当前位置: 首页 > 面试题库 >

您在Java中建议使用哪种HTML解析库?

梁丘钊
2023-03-14
问题内容

我想解析一些HTML,以便找到某些属性/标签等的值。

您推荐什么HTML解析器?任何利弊?


问题答案:

NekoHTML,TagSoup和JTidy将允许您解析HTML,然后使用XML工具(例如XPath)进行处理。



 类似资料:
  • 问题内容: 仅Java库中就有8个布局管理器,然后还有一堆3rd party产品。 前几天,我尝试使用SpringLayout并…好吧,它对我来说没有用。看到我的另一个问题。所以…如果你有一个Swing应用设计,并希望您的布局 只是这样 ,什么是您的首选布局管理器?有什么有趣/有用的经验可以联系吗? 更新:是的 ,请确保我知道不同的LM适用于不同的布局。但是我希望你们中的大多数人在所做的大部分事情

  • 问题内容: 有很多Java嵌入式VM。您对ARM开发有何建议? http://www.cacaovm.org/ http://www.rtjcom.com/main.php?p=home http://www.k-embedded-java.com/ http://jamvm.sourceforge.net/ 我目前正在使用达拉斯的TINI平台,并且运行良好(512 KB RAM和1 MB闪存),

  • 问题内容: 想知道社区对各种可用的和免费的Java Profiler和性能分析工具有何看法。 问题答案: JProfiler对我们来说效果很好。 http://www.ej- technologies.com/products/jprofiler/overview.html

  • 问题内容: 编写了很多解析器。到目前为止,我一直使用HtmlUnit无头浏览器进行解析和浏览器自动化。 现在,我想将两个任务分开。 由于我80%的工作仅涉及解析,因此我想使用简单的HTML解析器,因为在HtmlUnit中花很多时间才能首先加载页面,然后获取源然后解析它。 我想知道哪个HTML解析器是最好的。如果解析器与HtmlUnit解析器接近,则解析器会更好。 编辑: 最好的情况是,我至少需要以

  • 问题内容: 据我所知,Python中两个主要的HTML解析库是lxml和BeautifulSoup。我为正在从事的项目选择了BeautifulSoup,但是我选择它的原因并不多,除了找到更易于学习和理解的语法外。但是我看到很多人似乎都喜欢lxml,而且我听说lxml更快。 所以我想知道一个相对于另一个的优势是什么?我什么时候要使用lxml,什么时候可以使用BeautifulSoup更好?还有其他值

  • 问题内容: 我想知道是否有一种简单的方法可以解析vb.net中的HTML。我知道HTML并不是XML的严格子集,但是如果可以这样处理的话,那就太好了。是否有什么可以让我在VB.net中以类似XML的方式解析HTML的? 问题答案: 我喜欢Html Agility包 -它对开发人员非常友好,免费并且提供源代码。