当前位置: 首页 > 知识库问答 >
问题:

Java:使用JSoup提取其中包含某个单词的所有链接?

徐皓君
2023-03-14

可能是一个不清楚的问题,下面是代码和说明:

    Document doc = Jsoup.parse(exampleHtmlData);

    Elements certainLinks = doc.select("a[href=google.com/example/]");

字符串exampleThmlData包含来自特定站点的已解析HTML源。这个网站有很多链接可以将用户直接链接到谷歌。例如:

http://google.com/example/hello 
http://google.com/example/certaindir/anotherdir/something
http://google.com/anotherexample

我想提取所有包含谷歌的链接。com/example/位于与文档的链接中。选择函数。如何使用JSoup实现这一点?

共有1个答案

支彭亮
2023-03-14

您可以参考选择器语法。

Document doc = Jsoup.parse(exampleHtmlData);
Elements certainLinks = doc.select("a[href*=google.com/example/]");
 类似资料:
  • 我试图提取JSOUP中给定元素中的链接。这里我做了什么但它不起作用: 我正在尝试做的事情是获得所有的链接与文章类。我想,也许首先我必须选择section class=“row”,然后从article类派生链接,但我无法使其工作。

  • 问题内容: 我正在尝试从文本中提取所有包含指定单词的句子。 但它正在回报我: 代替 : 有什么帮助吗? 问题答案:

  • 如果案文是: 我想要一个句子(句子边界是句号,后面是空格),其中有“他”和“米兰”,即第三个句子(顺序不重要。任何同时有这两个词的句子都是必需的) 我尝试了上面的regex pattrn和其他许多方法 但是它在'milan'之后提取部分句子,或者从第一个'he'开始提取两个句子 请建议使用regex或Java中的任何其他方法完成此任务的方法 (我正致力于提取2个实体之间的关系模式:在这种情况下,关

  • 我目前正在尝试用PHP从包含html标记的文本中获取所有单词 我的regex有一个问题,如果一个单词以重音结束(例如“é”),我的单词就不会被捕获。

  • 我的文件:syn.txt 一切都很好,除了同义词: 我做了一些研究,我发现了以下几点: 所以我试图改变我的配置文件,并在索引中添加过滤器,但它不起作用。 什么东西有什么想法吗?