当前位置: 首页 > 软件库 > Web应用开发 > HTML解析器 >

wiseparser

PHP的HTML解析
授权协议 Apache
开发语言 PHP
所属分类 Web应用开发、 HTML解析器
软件类型 开源软件
地区 不详
投 递 者 易流觞
操作系统 跨平台
开源组织
适用人群 未知
 软件概览

wiseparser 是一个 PHP 语言用来解析 HTML 文档的开发包。

示例代码:

require_once('treebuilder.php');

$mytree = new Tree();<br>
$mytree->parse_content('&lt;div&gt;Hello world&lt;/div&gt;');
// or
$mytree->parse_file('http://www.google.com');
$mytree->parse_file('myfile.htm');

// To print HTML, just do:
echo $mytree;

// For those of you who familiar with HTML::Treebuilder, usage is almost the same. Implemented methods:

 // same as HTML::Element
Element->attr($attr, $value = null);
Element->tag($tag = null);
Element->look_down($keys);
Element->traverse($callback, $text_only=false);
Element->push_content($test_or_node, ..);
Element->unshift_content($test_or_node, ..);
Element->detach();
Element->preinsert($test_or_node, ..);
Element->postinsert($test_or_node, ..);
Element->as_HTML();
Element->as_text();
// plus one additional method:
Element->seek_n_destroy($keys); // same as look_down()->detach()->__destruct();

// same as HTML::Treebuilder:
Tree->parse_content($content);
Tree->parse_file($filename_or_url);

 相关资料
  • 本文向大家介绍使用PHP的HTML DOMDocument解析HTML,包括了使用PHP的HTML DOMDocument解析HTML的使用技巧和注意事项,需要的朋友参考一下 可以通过以下代码获取<div>标记内的<div>标记内的文本,其中<div>内的class =“ main”内- 示例 输出结果 这将产生以下输出-

  • HTML5 Boilerplate 默认提供两个 html 页面: index.html 404.html index.html no-js类 no-js 类可以让开发者依据 JavaScript 被启用(.js)或被禁止(.no-js)两种状态,更轻易准确地添加自定义样式。 使用这个技巧也有助于避免浏览器闪烁(FOUC)。 lang 属性 请认真考虑在 <html> 中添加 lang 属性,从而

  • 问题内容: 我正在开发一个从网站上抓取数据的应用程序,我想知道应该如何获取数据。具体来说,我需要包含在使用特定CSS类的许多div标签中的数据-目前(出于测试目的)我只是在检查 在HTML的每一行中-都可以,但是我不禁感到有更好的解决方案。 有什么好方法可以给类添加一行HTML并提供一些好方法,例如: 问题答案: “ JTidy是HTML Tidy的Java端口,HTML Tidy是HTML语法检

  • 问题内容: 在nodejs上有像Ruby的nokogiri这样的东西吗?我的意思是用户友好的HTML解析器。 我在Node.js模块页面上看到了一些解析器,但是找不到漂亮又新鲜的东西。 问题答案: 如果要构建DOM,可以使用jsdom。 还有cheerio,它具有jQuery接口,并且比旧版本的jsdom快很多,尽管如今它们的性能相似。 您可能想看一下htmlparser2,它是一个流解析器,根据

  • 问题内容: 什么HTML解析器具有以下功能: 快速 线程安全 可靠且无错误 解析HTML和XML 处理错误的HTML 有一个DOM实现 支持HTML4,JavaScript和CSS标签 相对简单的面向对象的API 您认为哪种解析器更好? 谢谢。 问题答案: ApacheTika是最佳选择。Apache最近从现有项目中提取了许多子项目并将其公开。提卡(Tika)是其中之一,以前是Apache Luc

  • 问题内容: 我在Goji框架上运行了一些东西: 我希望有人能帮助我做的是弄清楚如何提交HTML表单以将数据发送到Golang代码。 因此,如果存在一个带有name属性的输入字段,并且该属性的值是name,并且用户在其中输入名称并提交,那么在提交的表单页面上,Golang代码将打印问候,名称。 这是我能想到的: 这是我的hello.html文件: 在身体里: 如何连接到使Golang代码获取的是在表

  • 问题内容: 我试图显示基于JSON数据的“排行榜”表。 我已经阅读了很多有关JSON格式的文章,并克服了一些最初的障碍,但是我的Javascript知识非常有限,需要帮助! 基本上,我的JSON数据是通过如下形式获得的: 我需要的是能够遍历此数组,为每个对象生成一个表行或列表项。数组中的对象总数未知,但是每个对象具有相同的格式-三个值:名称,得分,团队。 到目前为止,我已经使用了以下代码,该代码确

  • 用于解析html网页数据。 作者说:ZHParseHtmlData这个类是我自己写的,解析html的。发现之前用过的TFHpple还有许多都有问题,有的GB2312或者其他编码会乱码或者是不规范的Xml或者不规范的html都解析不出来。现在用我这个类让浏览器对之前页面优化再解析就可以了,只要解析的类是GDataXMLNode,谷歌的东西。也可以用JS解析,但是那样太麻烦,为何不拿着谷歌现有的用呢。