<?php //--------------------------------------- // Html 标记WAP语言 //---------------------------------------- function html2wml($content) { //保留图片 preg_match_all("/<img([^>]*)>/isU", $content, $imgarr); if(isset($imgarr[0]) && count($imgarr[0])>0 ) { foreach($imgarr[0] as $k=>$v) $content = str_replace($v, "WAP-IMG::{$k}", $content); } // 过滤掉样式表和脚本 $content = preg_replace("/<style .*?<\\/style>/is", "", $content); $content = preg_replace("/<script .*?<\\/script>/is", "", $content); // 首先将各种可以引起换行的标签(如<br />、<p> 之类)替换成换行符"\\n" $content = preg_replace("/<br \\s*\\/?\\/>/i", "\\n", $content); $content = preg_replace("/<\\/?p>/i", "\\n", $content); $content = preg_replace("/<\\/?td>/i", "\\n", $content); $content = preg_replace("/<\\/?div>/i", "\\n", $content); $content = preg_replace("/<\\/?blockquote>/i", "\\n", $content); $content = preg_replace("/<\\/?li>/i", "\\n", $content); // 将" "替换为空格 $content = preg_replace("/\\ \\;/i", " ", $content); $content = preg_replace("/\\ /i", " ", $content); // 过滤掉剩下的 HTML 标签 $content = strip_tags($content); // 将 HTML 中的实体(entity)转化为它所对应的字符 $content = html_entity_decode($content, ENT_QUOTES, "GB2312"); // 过滤掉不能转化的实体(entity) $content = preg_replace('/\\&\\#.*?\\;/i', '', $content); // 上面是将 HTML 网页内容转化为带换行的纯文本,下面是将这些纯文本转化为 WML。 $content = str_replace('$', '$$', $content); $content = str_replace("\\r\\n", "\\n", htmlspecialchars($content)); $content = explode("\\n", $content); for ($i = 0; $i < count($content); $i++) { $content[$i] = trim($content[$i]); // 如果去掉全角空格为空行,则设为空行,否则不对全角空格过滤。 if (str_replace(' ', '', $content[$i]) == '') $content[$i] = ''; } $content = str_replace("<p><br /></p>\\n", "", '<p>'.implode("<br /></p>\\n<p>", $content)."<br /></p>\\n"); //还原图片 if(isset($imgarr[0]) && count($imgarr[0])>0 ) { foreach($imgarr[0] as $k=>$v) { $attstr = (preg_match('#/$#', $imgarr[1][$k])) ? '<img '.$imgarr[1][$k].'>' : '<img '.$imgarr[1][$k].' />'; $content = str_replace("WAP-IMG::{$k}", $attstr, $content); } } $content = preg_replace("/&[a-z]{3,10};/isU", ' ', $content); return $content; } function text2wml($content) { $content = str_replace('$', '$$', $content); $content = str_replace("\\r\\n", "\\n", htmlspecialchars($content)); $content = explode("\\n", $content); for ($i = 0; $i < count($content); $i++) { // 过滤首尾空格 $content[$i] = trim($content[$i]); // 如果去掉全角空格为空行,则设为空行,否则不对全角空格过滤。 if (str_replace(" ", "", $content[$i]) == "") $content[$i] = ""; } //合并各行,转化为 WML,并过滤掉空行 $content = str_replace("<p><br /></p>\\n", "", "<p>".implode("<br /></p>\\n<p>", $content)."<br /></p>\\n"); return $content; } ?>
WAP/WML templates require a php Content-Type header to be passed along with the template. The easist way to do this would be to write a custom function that prints the header. If you are using caching
我有使用ckeditor生成的html文本,在我的文本中有一些非html标记,它们没有被显示,因为它们被认为是html标记。 我想将所有非HTML标记替换为HTML实体。我用str_replace做了大多数标记,但现在我有大约100个不同的标记,像
我之所以发布这个问题,是因为许多开发人员或多或少地以不同的形式问同一个问题。我会自己回答这个问题(我是iText Group的创始人/首席技术官),这样它就可以成为“维基答案”如果堆栈溢出的“文档”特性仍然存在,那么这将是文档主题的一个很好的候选者。 我正在尝试将以下HTML文件转换为PDF: 在浏览器中,这种超文本标记语言如下所示: HTMLWorker根本不考虑CSS 当我使用时,我需要创建一
我正在使用ITextRenderer从html生成PDF。然而,我得到以下异常: 你能帮帮我吗? 任何帮助都将不胜感激。 先谢谢你。