当前位置: 首页 > 面试题库 >

使用Java中的XPath查询HTML的库?

韩嘉祯
2023-03-14
问题内容

谁能推荐我一个Java库来允许我通过URL进行XPath查询?我尝试JAXP失败。

谢谢。


问题答案:

jsoup,Java HTML Parser非常类似于jQuery语法方式。



 类似资料:
  • 问题内容: 我要对此文件执行XPath查询(显示的摘录): 这是我正在使用的代码的摘要: 我面临的问题是,在XPath查询中引用默认名称空间时,不会调用getNamespaceURI方法来解决它。例如,此查询不提取任何内容: 现在,我尝试通过用假前缀替换来“诱骗”解析器,然后相应地编写方法(以便在遇到问题时返回)。在这种情况下,将调用,但是XPath表达式求值的结果始终是一个空字符串。 如果我从文

  • 我想对这个文件进行XPath查询(显示节选): 这是我正在使用的代码片段: 我面临的问题是,在XPath查询中引用默认名称空间时,不会调用getNamespaceURI方法来解决它。例如,此查询不提取任何内容: 现在,我尝试“欺骗”解析器,用假前缀替换,然后相应地编写方法(以便返回当遇到时)。在本例中,调用了,但XPath表达式求值的结果始终是空字符串。 如果我从文件和XPath查询表达式中去掉名

  • 问题内容: 当我的XML看起来像这样(no )时,我可以使用XPath轻松查询它 但是当看起来像这样我就不能 有任何想法吗? 问题答案: 在第二个示例XML文件中,元素绑定到名称空间。你的XPath尝试处理绑定到默认“无名称空间”名称空间的元素,因此它们不匹配。 首选方法是使用名称空间前缀注册名称空间。它使你的XPath更加易于开发,读取和维护。 但是,并不一定要注册名称空间并在XPath中使用名

  • 问题内容: 我正在使用Java程序内的XPath从HTML页面抓取值以获取特定标签,并偶尔使用正则表达式来清理接收到的数据。 经过一番研究,我找到了HTML Cleaner(http://htmlcleaner.sourceforge.net/)作为将原始HTML解析为良好XML格式的最可靠方法。但是,HTML Cleaner仅支持XPath 1.0,我发现自己需要“包含”之类的功能。例如,在这段

  • 问题内容: 我有一个带有一个XML列的表。我想过滤掉XML中特定属性与字符串匹配的行,实质上是在WHERE或HAVING中进行。 桌子看起来像这样 和XML类似 我想获取所有@name属性与值匹配的ID。 我已经能够做到以下几点: 但这非常慢。 必须有更好的方法来对查询的输出进行过滤。 问题答案: 找到了。而不是使用query(),我应该使用exist()。 我的查询将是

  • 这个问题给出了正确的节点,但是所有的节点都同时给出了。 还有当时,它什么也不返回?