当前位置: 首页 > 面试题库 >

TagSoup,Jsoup,HTML解析器,HotSax和

凌运恒
2023-03-14
问题内容

可供选择(并坚持使用)的大量HTML解析器令人难以置信:

http://java-source.net/open-source/html-parsers

如何选择最适合以下要求的产品:

  1. 成熟(错误比其他错误少)
  2. 生活和呼吸(即得到维持)
  3. 快速且资源高效(打算在Android上运行)

根据您的经验,您会推荐哪种HTML解析器(以满足上述要求),为什么?


问题答案:

好吧,我找到了答案,它是由@BalusC在另一个线程上给出的:

  1. 如果只想使用基于XML的工具来遍历它:JTidy。
  2. 如果您想对HTML进行单元测试: HtmlUnit
  3. 如果您想从HTML中提取特定数据:Jsoup

谢谢@BalusC。



 类似资料:
  • 主要内容:Jsoup 解析HTML正文 语法,Jsoup 解析HTML正文 说明,Jsoup 解析HTML正文 示例以下示例将展示将 HTML 片段字符串解析为 Element 对象作为 html 正文。 Jsoup 解析HTML正文 语法 document : 文档对象代表 HTML DOM。 Jsoup : 解析给定 HTML 字符串的主类。 html : HTML 片段字符串。 body : 表示文档正文元素的子元素,等效于 document.getElementsByTag("body"

  • 我想解析出这个Nasa页面上的描述,页面底部的文字 我该怎么做?

  • 我试图在这里使用JSOUP解析html标记。我对jsoup是新来的。基本上,我需要解析这些标记,获取这些标记中的文本,并应用class属性中提到的样式。 我正在创建一个SpannableStringBuilder,它可以创建子字符串,应用样式,并将它们附加到没有样式的文本中。 我不确定如何解析不在任何标记之间的字符串,例如“there are”和“worker from the”。 需要输出,例如

  • 主要内容:Jsoup 使用DOM解析HTML 语法,Jsoup 使用DOM解析HTML 说明,Jsoup 使用DOM解析HTML 示例以下示例将展示在将 HTML 字符串解析为 Document 对象后如何使用类似 DOM 的方法。 Jsoup 使用DOM解析HTML 语法 document : 文档对象代表 HTML DOM。 Jsoup : 解析给定 HTML 字符串的主类。 html : HTML 字符串。 sampleDiv : 元素对象表示由 id“sampleDiv”标识的 html

  • 我需要的是在第二个中获取第二个 的文本,并对表中的每一组 标记执行此操作。

  • 问题内容: 这是我的HTML来源 这是我获取内容的Java程序,它过滤HTML标记 是否有使用Jsoup而不是使用Java而不是Regex解析HTML内容的简便方法 有没有办法只获取所需的内容。所以在这里我只需要内容“项目2-222” 问题答案: 尝试使用jsoup轻松解析: 要了解更多信息,请访问Jsoup Docs