问题：

Jsoup：在标记之前获取最近的html标记

淳于烈

2023-03-14

我去一个标签名

我正在使用java。

共有1个答案

艾俊悟

2023-03-14

OP找到了一个答案：

我想我有自己的答案。这是lastElementSibling（）。我在这个Jsoup API中读到了它，我希望它能帮助像我这样的人。

类似资料：

Jsoup在两个标记之间获取html

在像这样的网站上http://wikitravel.org/en/San_Francisco，诸如“Districts”、“Understand”、“Get in”等部分实际上并不包含HTML中的整个部分。节实际上只是标题中的跨类。正因为如此，我们不能简单地通过选择id来获取wiki文档的某些部分。但是，是否可以收集两个标记之间的所有html？比如说我想要“四处走动”部分。我该如何发出一个选择器
使用jsoup或regex在标题标记之间提取html标记

嗨，我有一个html文件解析的场景。我正在使用jsoup解析html文件，解析后我想提取头标记（h1、h3、h4）。我用过医生。select（）但它将只返回标题标记值，但我的要求是我应该提取h1到h3或h4之间的标记，反之亦然。所以这里首先搜索html字符串是否包含任何H1，H3，H4。这里我们有h4，所以包括h4，它应该搜索下一个h1或h3，直到h3我们提取字符串并把它放在一个单独的html文
Jsoup从两个标记之间的html获取数据

我正在从事一个个人项目，希望解析这个html并从中检索信息。基本上，我希望获得标记中给出的所有信息，为此，我在java中使用JSOUP。我使用这段代码来获取，但这是在一个段落中给出所有值。我也试过了但他的观点是空泛的。有人能帮我以更好的方式获得这些数据吗？
JSoup-逐标记解析HTML标记

我实际上正在用Java开发一个文本解析器，有人要求我通过用它解析HTML来增强它。解析器的目的是将被解析的文件分成另外三个文件，一个包含文件中包含的所有单词，一个包括所有句子，另一个包含所有问题。 *.txt部分工作得很好，但我在解析HTML时遇到了一个问题。我创建了一个扩展名为*.txt的临时文件，并将其在我的文本解析器中传递，但是如果我传递一个带有HTML文件链接的URL，其格式如下所示：
Jsoup只删除html标记

什么是正确的方法来删除只有HTML标签（保留所有自定义/未知的标签）与JSOUP（不是正则表达式）？预期输入：预期产出：我尝试使用白名单清洁剂。none（），但它也会删除自定义标记。我也尝试过：但是它也删除了自定义标签。这个答案对我不好，因为自定义标记的数量是无限的。
Jsoup无法获取带有嵌套标记的外部HTML

在我使用Jsoup连接到Instagram页面后，我想从一个标记中提取整个外部html。不知怎的，当我检查页面并从标记中复制外部html时，我得到了大量的行，而我使用Jsoup只得到了很少的行（不知怎的，嵌套标记的html被忽略了）任何帮助都将感谢如何获得整个html！代码：输出：编辑：我希望保存span标记的整个HTML（我希望HTMLUnit/JSOUP的结果与我右键单击标记时的结果相同

Jsoup：在标记之前获取最近的html标记

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档