我们知道 PHP 有个 strip_tags
函数,可以从字符串中去除 HTML 和 PHP 标签,比如,
$text = '<p>Test paragraph.</p><!-- Comment --> <a href="#fragment">Other text</a>';
echo strip_tags($text);
echo "n";
// 允许 <p> 和 <a>
echo strip_tags($text, '<p><a>');
// 自 PHP 7.4.0 起,上面的行可以写成:
// echo strip_tags($text, ['p', 'a']);
上面程序会输出
代码语言:javascript复制Test paragraph. Other text
<p>Test paragraph.</p> <a href="#fragment">Other text</a>
但是熟悉 WordPress 的同学,知道 WordPress 也有一个类似的函数 wp_strip_all_tags
,它也是一样功能,为什么 WordPress 要创建这个函数呢?有什么不同的地方?
和 strip_tags
函数不同是, wp_strip_all_tags
函数同时也移除 <script>
和 <style>
标签的内容,什么意思呢?查看下面这段代码就很明显了:
strip_tags('<script>something</script>'); // 输出 "something"
wp_strip_all_tags('<script>something</script>'); // 输出 ""
其实查看 wp_strip_all_tags
函数,它先通过正则移除 <script>
和 <style>
标签和其内容,在调用 strip_tags
进行处理,最后根据参数决定是否移除空行:
function wp_strip_all_tags( $string, $remove_breaks = false ) {
$string = preg_replace( '@<(script|style)[^>]*?>.*?</\1>@si', '', $string );
$string = strip_tags( $string );
if ( $remove_breaks ) {
$string = preg_replace( '/[rnt ] /', ' ', $string );
}
return trim( $string );
}
那么开发中具体使用哪个函数呢?一般来说需要根据情况来定,但是据我的经验,大部分情况下应该使用 wp_strip_all_tags
函数,因为样式和脚本的代码的确不是内容。