WPJAM Basic 内置的字符串处理函数

2023-04-13 14:10:16 浏览数 (1)

文本处理是 PHP 开发中常进行的操作,所以 WPJAM Basic 也内置了一些常用的文本和字符串处理函数,可以在进行 WordPress 主题和插件二次开发的时候,直接使用。

wpjam_strip_invalid_text

WordPress 字符数据字段格式已经升级为:utf8mb4,就是说支持 emoji 等4个字节的字符,但是在开发的时候发现用户还是会输入一些 utf8mb4 还不支持的字符,可以使用该函数过滤掉非 utf8mb4 字符:

代码语言:javascript复制
wpjam_strip_invalid_text($str);

wpjam_strip_4_byte_chars

有些情况下,我们要过滤掉4字节的字符,可以使用下面的函数:

代码语言:javascript复制
wpjam_strip_4_byte_chars($chars);

wpjam_strip_control_characters

如果字符中有控制字符,json_decodesimplexml_load_string 函数就会失败,我们首先要把这些控制字符去掉:

代码语言:javascript复制
wpjam_strip_control_characters($text);

wpjam_get_plain_text

下面函数去掉 html 标签,去掉换行,去掉多余的空格,去掉双引号和单引号:

代码语言:javascript复制
wpjam_get_plain_text($text);

wpjam_get_first_p

获取文章的第一段:

代码语言:javascript复制
wpjam_get_plain_text($text);

wpjam_mb_strimwidth

按照中文 2 个字节,英文 1 个字节的方式截取文字,这个函数其实就是首先使用 wpjam_get_plain_text 函数获取纯文本,再使用 PHP 的 mb_strimwidth 进行截取:

代码语言:javascript复制
wpjam_mb_strimwidth($text, $start=0, $width=40, $trimmarker='...', $encoding='utf-8')

wpjam_unicode_decode

如果中文已经被 json_encode 编码成 unicode 之后,可以使用下面该函数将 unicode 转换回中文:

代码语言:javascript复制
wpjam_unicode_decode($str)

0 人点赞