当前位置: 首页 > 知识库问答 >
问题:

关闭标签被JSoup忽略

钱劲
2023-03-14

我有一个作为字符串接收的HTML文档,然后使用jSoup解析它。此HTML文档(字符串形式)包含

<link rel="stylesheet" href="css/bootstrap.css" />

这就是我解析它的方式-

Document doc = Jsoup.parse(html);

其中html是字符串形式的html文档。

当我打印doc时,解析后,除了之外,一切都保持不变

  <link rel="stylesheet" href="css/bootstrap.css"> 

请注意,这里没有结束斜杠。还要注意,如果原始字符串包含

<link rel="stylesheet" href="css/bootstrap.css"></link>

结果仍然是一样的,即,

谢谢


共有2个答案

羊新翰
2023-03-14

如果您希望避免修改标签,请尝试:

Document htmldoc = Jsoup.parse(html, baseuri, Parser.xmlParser());
冷涵忍
2023-03-14

根据HTML5规范

text/html中的标记省略:
无结束标记。

所以规范说不应该有结束标签。规范允许结束标记使元素无效,但这不是默认的。我猜JSoup遵循超文本标记语言规范。

 类似资料:
  • 问题内容: 我的网页上有一个关闭链接。我想使用它来关闭当前选项卡。我已经写了 上面的代码在Internet Explorer中似乎运行良好。但它不能在Mozilla Firefox和Google Chrome中使用。请帮助我解决此问题。 问题答案: 您只能关闭自己创建的窗口/选项卡。也就是说,您无法以编程方式关闭用户创建的窗口/选项卡。 例如,如果使用创建一个窗口,则可以使用关闭它。

  • 我的Java程序看起来像: 输出为:<代码> 因为我使用的是JasperReports和html样式,只允许我想要的输出。如何做到这一点?Transformer或DocumentBuilderFactory是否有任何输出属性可以进行想要的输出?

  • 问题内容: 使用最新的JSoup 1.7.2版存在一个错误,该错误分析带有 未关闭标签的* 无效 HTML 。 * 例: 生成的文档为: 浏览器将生成如下内容: Jsoup应该用作浏览器或源代码。 有什么解决办法吗?调查API我什么也没找到。 问题答案: 正确的行为是在解析此无效的HTML时充当其他浏览器。感谢您提交此错误。我已解决了阻止采用机构将原始属性保留在新节点中的问题。它将在1.7.3中可

  • 问题内容: 每当我们从数据库或类似来源获取一些用户输入的内容并进行一些编辑时,我们都可能会检索仅包含开始标记但没有结束标记的部分。 这可能会妨碍网站的当前布局。 有客户端或服务器端的方法可以解决此问题吗? 问题答案: 找到了一个很好的答案: 使用PHP 5并使用DOMDocument对象的loadHTML()方法。此自动解析格式错误的HTML,随后对saveXML()的调用将输出有效的HTML。D

  • 问题内容: 我想知道为什么HTML 标记没有像其他HTML标记那样获得结束标记,如果我们关闭输入标记会出现什么问题呢? 我尝试使用Google,但发现写这样的输入标签的标准没有用来 关闭它。 当我使用以下命令为按钮创建输入标签时,我个人感觉到了问题 尽管创建了单选按钮,但我将附加到单选按钮 不起作用。它只是显示单选按钮,在这种情况下不显示。虽然我可以看到完整的代码: 有人可以解释吗? PS :我遇

  • 问题内容: 其中哪一个是正确的? 问题答案: 工作正常,并正确关闭标签。最好为视障人士添加属性。