问题：

在 Java 中使用 JSoup 从 HTML 中解析标记数据

狄玉书

2023-03-14

如何从下面的html中解析出46389333？

 <a href="/exampleTweet/status/46389333"

我使用的是JSoup，显然我可以解析文本、标签和其他值。但是我不知道如何解析这个值。即使我只能解析出/exampleTweet/status/46389333，至少我可以解析这个字符串，这要容易得多。问题是，数字变了，显然例子也变了。不过，地位还是存在的，所以也许我可以利用这一点？任何帮助都是巨大的。

共有1个答案

祝花蜂

2023-03-14

决定只使用Element的“toString（）”函数，然后对该字符串进行定界。希望这能帮助将来的人！

类似资料：

使用Jsoup解析HTML div标记

我试图从这些div标签中获取文本，但是它们都不返回任何内容: HTML: 我想得到div类“消息”和h4标记和跨越“日期时间”中的文本，我试图：和：但是他们没有成功。
JSoup-逐标记解析HTML标记

我实际上正在用Java开发一个文本解析器，有人要求我通过用它解析HTML来增强它。解析器的目的是将被解析的文件分成另外三个文件，一个包含文件中包含的所有单词，一个包括所有句子，另一个包含所有问题。 *.txt部分工作得很好，但我在解析HTML时遇到了一个问题。我创建了一个扩展名为*.txt的临时文件，并将其在我的文本解析器中传递，但是如果我传递一个带有HTML文件链接的URL，其格式如下所示：
使用java和jsoup从html标记中提取值

我有这个html 并且，我试图得到每个标签的href。例如，
在Jsoup中解析html

我试图在这里使用JSOUP解析html标记。我对jsoup是新来的。基本上，我需要解析这些标记，获取这些标记中的文本，并应用class属性中提到的样式。我正在创建一个SpannableStringBuilder，它可以创建子字符串，应用样式，并将它们附加到没有样式的文本中。我不确定如何解析不在任何标记之间的字符串，例如“there are”和“worker from the”。需要输出，例如
使用jsoup解析html并删除标记块

问题内容：我想删除标签之间的所有内容。输入示例可能是输入：输出将是：基本上，我必须先删除整个区块谢谢，问题答案：您最好对找到的所有元素进行迭代。所以你可以保证 a。）所有元素都被删除并且 b。）如果没有元素，那么什么也做不了。例：编辑：（除了我的评论）当简单的 null /范围检查在这里足够时，请不要使用异常处理：代替：
使用 Jsoup 解析 dl 标记

我正在尝试解析

在 Java 中使用 JSoup 从 HTML 中解析标记数据

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档