当前位置: 首页 > 知识库问答 >
问题:

为什么Jsoup不能解析tagName“link”

班经亘
2023-03-14

我在我的Jsoup项目中有这个有线senario

<html>
..

<link> example.com </link>
..

</html>
System.out.println(document.select("link").text()) ;//nothing gets printed. (it should print **example.com**)
<html>
..

<someOtherTage> example.com </someOtherTage>
..

</html>
System.out.println(document.select("someOtherTage").text()); //prints **example.com**

这是jsoup中的一个bug,还是标记名“link”有什么特殊的地方?

注意:Jsoup版本使用了1.6和1.9。Java 7和8

共有1个答案

姚实
2023-03-14

由于link元素是一个空元素,所以JSoup对该元素进行了清理,并将其内容移到了正文中。(通过打印文档来验证这一点)。

要保留link元素中的内容,请切换到XML解析模式:

Document doc = Jsoup.parse(html, "", Parser.xmlParser());
 类似资料:
  • 问题内容: 我想将jsoup解析为utf -8,但我不能。我尝试了我所知道的一切,然后在Google上进行了搜索。 我的目标是: 但是 不是。 请帮忙 问题答案: 淘汰 你好世界Öçasasa

  • (下的唯一div) 还有更多关于参数的... 我也给了任何其他标签一个镜头,但我得到同样的问题。 最接近成功的是:。这将返回所有视频标题。但可悲的是,也有一些与其他文本的其他链接。因此不可靠。 下面是实现JSOUP的代码: 我尝试提取的示例:我正在查找的HTML块的图像 我好像错过了很多人说Jsoup很棒很简单的东西...(在我的情况下不是:v)

  • 为什么我无法解析符号“r”..??。当我在这个.class文件上创建新活动时,我会遇到一个问题,为什么我不知道在创建类之后我什么也没做。(在R.Layout.Dashboard中)。(“红色R”)。 请帮帮我.

  • 问题内容: 我无法使用Jsoup库从此处获取div 。 这是我的代码: 问题答案: 此标记中的文本不是初始html的一部分,而是在页面加载后由JavaScript设置的。您可以通过在浏览器中禁用JavaScript进行检查。Jsoup仅获取静态html,不执行JavaScript代码。 当您检查从页面建立的连接时,您会发现该值是通过对此API的请求进行更新的: https://shapeshift

  • 我想解析一个HTML表,但我不明白如何获得值。我有这张桌子: 你能为我杀一儆百吗?我要分析此表得所有值...提前谢谢! 编辑:SPAN值:

  • 但是当我使用Java8时, 它抛出 java.time.format.DateTimeParseException:无法分析文本“201510”:无法从TemporalAccessor获取LocalDate:{Year=2015,MontHofYear=10},ISO类型为java.time.Format.Parsed