当前位置: 首页 > 知识库问答 >
问题:

如何用JSoup解析以开头的片段?

闽阳州
2023-03-14

使用JSoup,我试图解析一个

https://jsoup.org/cookbook/input/parse-body-fragment:您有一个要解析的主体HTML片段(例如,一个包含两个p标记的div;与完整的HTML文档相反)。

当我在

有没有其他方法可以在不将片段添加到文档体的情况下解析该片段?


共有1个答案

屈翰飞
2023-03-14

您可以使用xmlParser。它将跳过HTML验证,并获得与输入完全相同的文档。

Document doc = Jsoup.parse(html, "", Parser.xmlParser());
 类似资料:
  • 问题内容: 如何将“ 09”解析为9? 问题答案: 包括基数:

  • 问题内容: 我正在尝试使用jsoup解析HTML。这是我第一次使用jsoup,并且我也阅读了有关它的一些教程。以下是我要解析的HTML表- 如果您看到我的下表,则它现在有3个(我只是为了理解目的将其缩短为3个表行,但总的来说会更多)。现在,我想从我的下表中提取出它的对应信息,例如-我将提取其群集状态及其状态为关闭的所有主机名。 正如你可以看到下面的群集名称,我有两个主机名和其地位,但地位。 因此,

  • 正如您在下面看到的集群名称,我有两个主机名和,其中状态为,但状态为。 因此,我将打印作为集群名,并打印作为主机名,因为它已关闭。使用JSOUP可以做到这一点吗? 到目前为止,我能够使用jsoup提取整个HTML表,但不确定如何提取集群名和主机名- 更新:- 表中可能有两个集群名称,如下所示- 现在,如果您看到上面,我有两个集群名称--一个是,另一个是,所以我想找到所有仅为集群名称关闭的计算机。

  • 问题内容: 这是我必须从中提取值5390.85,5428.15,5376.15和5413.85的HTML源。我想使用jsoup做到这一点。但是我对jsoup比较陌生(今天我开始使用它)。那我该怎么办呢? 我已经使用jsoup提取了网站的内容。但是如何提取我需要的值?提前致谢 问题答案: 尝试这样的事情: 这是打印输出:-

  • 我有一个这样的表,我想解析它以获得和表的第二列和第三列。 我想打印出来。 我尝试了这个线程中的以下建议,但没有选择如何使用jsoup从HTML解析表 编辑:也尝试使用Jsoup.connect()代替parse()

  • 问题内容: 在页面中,我想选择一个变量的值。以下是页面的摘要。 我的目的是使用来从此页面读取变量的值。有可能吗?如果是,那怎么办? 问题答案: 由于jsoup不是javascript库,因此有两种方法可以解决此问题: A.使用JavaScript库 优点: 全面的Javascript支持 缺点: 附加的天秤/依赖项 B.使用Jsoup +手动解析 优点: 无需额外的库 足以完成简单的任务 缺点: