本文实例讲述了PHP正则删除HTML代码中宽高样式的方法。分享给大家供大家参考,具体如下:
因工作需要,需要采集html,并把html内容保存到数据库中。为了避免影响使用,宽高样式需要删除。例如图片和div中的width, height等。
不过采集到的html中,样式的写法各有不同,例如大小写,中间有空格等。
因此使用php正则编写了下面这个方法,对这些奇葩的样式进行过滤。
代码如下:
<?php /** * 清除宽高样式 * @param String $content 内容 * @return String */ function clear_wh($content){ $config = array('width', 'height'); foreach($config as $v){ $content = preg_replace('/'.$v.'\s*=\s*\d+\s*/i', '', $content); $content = preg_replace('/'.$v.'\s*=\s*.+?["\']/i', '', $content); $content = preg_replace('/'.$v.'\s*:\s*\d+\s*px\s*;?/i', '', $content); } return $content; } ?>
演示:
<?php $html = <<<HTML <div style="text-align:center" width="500" height="300"> <div style="Width : 100px ; Height: 100 px;"> <img src="/images/test.jpg" width=400 height = 200> <div style="float:left; width: 100px; height : 200 px;"></div> </div> <div style="width : 100 px ;height: 100px"> <img src="/images/test.jpg" width=400 height = 200> </div> </div> HTML; echo '<xmp>'; echo '原内容:'.PHP_EOL; echo $html.PHP_EOL.PHP_EOL; echo '过滤后内容:'.PHP_EOL; echo clear_wh($html); echo '</xmp>'; ?>
输出:
原内容: <div style="text-align:center" width="500" height="300"> <div style="Width : 100px ; Height: 100 px;"> <img src="/images/test.jpg" width=400 height = 200> <div style="float:left; width: 100px; height : 200 px;"></div> </div> <div style="width : 100 px ;height: 100px"> <img src="/images/test.jpg" width=400 height = 200> </div> </div> 过滤后内容: <div style="text-align:center" > <div style=" "> <img src="/images/test.jpg" > <div style="float:left; "></div> </div> <div style=""> <img src="/images/test.jpg" > </div> </div>
PS:这里再为大家提供2款非常方便的正则表达式工具供大家参考使用:
JavaScript正则表达式在线测试工具:
http://tools.jb51.net/regex/javascript
正则表达式在线生成工具:
http://tools.jb51.net/regex/create_reg
更多关于PHP相关内容感兴趣的读者可查看本站专题:《php正则表达式用法总结》、《PHP数组(Array)操作技巧大全》、《PHP基本语法入门教程》、《php字符串(string)用法总结》、《php+mysql数据库操作入门教程》及《php常见数据库操作技巧汇总》
希望本文所述对大家PHP程序设计有所帮助。
问题内容: 我刚刚在此处阅读了一个新问题,询问的标题与我的基本相同。那让我开始思考-并在网络上搜索(当然,大多数点击都指向SO;)。所以我认为 - 应该有一个简单的正则表达式,能够从任何代码中删除C样式的注释。 是的,关于SO的这个问题/陈述有答案,但是我发现的答案都是不完整和/或过于复杂。 因此,我开始进行实验,并提出了一个可以在 我 能想象的所有类型的代码上运行的代码: 第一种选择检查 双斜杠
问题内容: 我对正则表达式不太满意,但是对于PHP,我想从TinyMCE返回的字符串中的HTML标记中删除属性。 所以换成香草。 我将如何通过类似功能来实现这一目标? 问题答案: 务实的正则表达式将在所有合理的情况下解决此问题。不是第一个捕获组的匹配部分应删除,如下所示: 匹配一个后跟一个或多个“ not ”的字符,直到我们到达该部分为止。该更令其一起工作。将此匹配替换为,这是捕获的组。如果标记不
本文向大家介绍去除HTML标签删除HTML示例代码,包括了去除HTML标签删除HTML示例代码的使用技巧和注意事项,需要的朋友参考一下
问题内容: 我在网上找到了一个脚本,并且在JavaScript中有一个密码正则表达式。我仍然想使用它,但是为了获得更高的安全性,我也想使用PHP来验证我的密码,但是我对正则表达式毫无用处。 要求: 必须至少8个字符 必须包含至少1个数字 必须至少包含一个大写字符 必须至少包含一个小写字符 如何构造正则表达式字符串以满足这些要求? 问题答案: 我发现在一个大的正则表达式中执行此操作有点像代码维护的噩
问题内容: 从PHP文件中删除注释的最佳方法是什么? 我想做一些与strip-whitespace()类似的事情-但它也不应该删除换行符。 例如: 我要这个: 成为: (尽管如果在删除注释的地方仍然留有空行,那是不可能的)。 由于可能需要保留嵌入式html,因此这可能是不可能的-那是什么导致了google上出现的问题。 问题答案: 我会使用tokenizer。这是我的解决方案。它应该在PHP 4和