PHP过滤html注释

时间：2018-01-06 14:17:54 阅读：253 评论：0 收藏：0 [点我收藏+]

过滤html注释:

所谓过滤，不过是字符串的匹配与替换，这里我们用到的正则匹配替换函数preg_replace(reg,replace,string);，PHPer都清楚，这个函数的关键在于reg的精确度，那么我们就来试试看吧：

首先要知道html注释的格式，是这样的：。

开始正则的书写

$html = "<!--something-->something";
$html = preg_replace("/<!--.*-->/","",$html);
echo $html;

上面的代码将输出 something，似乎成功了呢，不急，多测试几个例子

$html = "<!--something-->something<!--something-->";
$html = preg_replace("/<!--.*-->/","",$html);
echo $html;

这个例子告诉我们，这样写并不能达到我们期望的效果，于是正则优化成了这样

preg_replace("/<!--.*？-->/","",$html);

嗯，这下满意了，但是html中会存在这样的代码，这是浏览器兼容代码，显然是不能被过滤的，所以我们的正则继续优化，变成这样

preg_replace("/<!--[^\!\[]*?-->/","",$html);

又接着如果html中有<script></script>的代码，我们又需要改一下我们的匹配规则了，改成了这样

preg_replace("/<!--[^\!\[]*?(?<!\/\/)-->/","",$html);

这样的话我基本上就去掉了我需要去掉的html的注释了！

意外收获：在优化过程中，没有多多行注释进行考虑，但规则意外的正常匹配了多行注释，不知道是否因为是从文件读取的html！

经测试尚未发现有将正文过滤掉的情况，如有疑问，欢迎留言指正。

原文地址：https://www.cnblogs.com/yiven/p/8213524.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

周排行