文本处理是 PHP 开发中常进行的操作,所以 WPJAM Basic 也内置了一些常用的文本和字符串处理函数,可以在进行 WordPress 主题和插件二次开发的时候,直接使用。
wpjam_strip_invalid_text
WordPress 字符数据字段格式已经升级为:utf8mb4,就是说支持 emoji 等4个字节的字符,但是在开发的时候发现用户还是会输入一些 utf8mb4 还不支持的字符,可以使用该函数过滤掉非 utf8mb4 字符:
代码语言:javascript复制wpjam_strip_invalid_text($str);
wpjam_strip_4_byte_chars
有些情况下,我们要过滤掉4字节的字符,可以使用下面的函数:
代码语言:javascript复制wpjam_strip_4_byte_chars($chars);
wpjam_strip_control_characters
如果字符中有控制字符,json_decode
和 simplexml_load_string
函数就会失败,我们首先要把这些控制字符去掉:
wpjam_strip_control_characters($text);
wpjam_get_plain_text
下面函数去掉 html 标签,去掉换行,去掉多余的空格,去掉双引号和单引号:
代码语言:javascript复制wpjam_get_plain_text($text);
wpjam_get_first_p
获取文章的第一段:
代码语言:javascript复制wpjam_get_plain_text($text);
wpjam_mb_strimwidth
按照中文 2 个字节,英文 1 个字节的方式截取文字,这个函数其实就是首先使用 wpjam_get_plain_text
函数获取纯文本,再使用 PHP 的 mb_strimwidth
进行截取:
wpjam_mb_strimwidth($text, $start=0, $width=40, $trimmarker='...', $encoding='utf-8')
wpjam_unicode_decode
如果中文已经被 json_encode
编码成 unicode 之后,可以使用下面该函数将 unicode 转换回中文:
wpjam_unicode_decode($str)