当前位置：首页 > 面试题库 >

TagSoup，Jsoup，HTML解析器，HotSax和

凌运恒

2023-03-14

问题内容：

可供选择（并坚持使用）的大量HTML解析器令人难以置信：

http://java-source.net/open-source/html-parsers

如何选择最适合以下要求的产品：

成熟（错误比其他错误少）
生活和呼吸（即得到维持）
快速且资源高效（打算在Android上运行）

根据您的经验，您会推荐哪种HTML解析器（以满足上述要求），为什么？

问题答案：

好吧，我找到了答案，它是由@BalusC在另一个线程上给出的：

如果只想使用基于XML的工具来遍历它：JTidy。
如果您想对HTML进行单元测试： HtmlUnit
如果您想从HTML中提取特定数据：Jsoup

谢谢@BalusC。

类似资料：

Jsoup 解析HTML正文

主要内容：Jsoup 解析HTML正文语法,Jsoup 解析HTML正文说明,Jsoup 解析HTML正文示例以下示例将展示将 HTML 片段字符串解析为 Element 对象作为 html 正文。 Jsoup 解析HTML正文语法 document ：文档对象代表 HTML DOM。 Jsoup ：解析给定 HTML 字符串的主类。 html ： HTML 片段字符串。 body ：表示文档正文元素的子元素，等效于 document.getElementsByTag("body"
使用JSoup解析HTML

我想解析出这个Nasa页面上的描述，页面底部的文字我该怎么做？
在Jsoup中解析html

我试图在这里使用JSOUP解析html标记。我对jsoup是新来的。基本上，我需要解析这些标记，获取这些标记中的文本，并应用class属性中提到的样式。我正在创建一个SpannableStringBuilder，它可以创建子字符串，应用样式，并将它们附加到没有样式的文本中。我不确定如何解析不在任何标记之间的字符串，例如“there are”和“worker from the”。需要输出，例如
Jsoup 使用DOM解析HTML

主要内容：Jsoup 使用DOM解析HTML 语法,Jsoup 使用DOM解析HTML 说明,Jsoup 使用DOM解析HTML 示例以下示例将展示在将 HTML 字符串解析为 Document 对象后如何使用类似 DOM 的方法。 Jsoup 使用DOM解析HTML 语法 document ：文档对象代表 HTML DOM。 Jsoup ：解析给定 HTML 字符串的主类。 html ： HTML 字符串。 sampleDiv ：元素对象表示由 id“sampleDiv”标识的 html
Android用JSoup解析html表

我需要的是在第二个中获取第二个的文本，并对表中的每一组标记执行此操作。
使用Jsoup解析HTML内容

问题内容：这是我的HTML来源这是我获取内容的Java程序，它过滤HTML标记是否有使用Jsoup而不是使用Java而不是Regex解析HTML内容的简便方法有没有办法只获取所需的内容。所以在这里我只需要内容“项目2-222” 问题答案：尝试使用jsoup轻松解析：要了解更多信息，请访问Jsoup Docs

TagSoup，Jsoup，HTML解析器，HotSax和

相关阅读

相关文章

相关问答

相关工具

相关文档