当前位置: 首页 > 知识库问答 >
问题:

使用JSoup查找HTML中“div”中的“Span”

赫连华皓
2023-03-14

我已经成功地在一个分隔符中获取了如下所示的文本:

使用此选项:

Document doc = Jsoup.connect("https://" + line).userAgent("Mozilla/17.0").get();
String goal = doc.select("div._6wae").html();

所以我知道我的方法可以在分隔符中查找文本,但我不确定如何在分隔符中查找跨度内的文本。

非常感谢!


共有2个答案

夔学智
2023-03-14

这应该做到:

Document doc = Jsoup.parse("<div class=_6wab><span>$35 raised</span></div><p><span>hi</span></p>");
//use css selectors
Elements rows = doc.select("div._6wab span");
System.out.println(rows.eachText());

产出:

[$35 raised]

注:仅打印div范围内的文本。此外,如果HTML中不存在该类,则不会引发任何NullPointerException。在这种情况下,将返回一个空列表。这还将捕获具有给定类的div中的所有跨度。

戚弘和
2023-03-14

这段代码可能有效。

首先,找到类为“6wab”的第一个div。

Element div = doc.getElementsByClass("_6wab").first();

然后,在得到div之后,找到内部跨度。

  Element span = div.select("span").first();

最后,获取文本。

System.out.println(span.text());
 类似资料:
  • 我试图从这些div标签中获取文本,但是它们都不返回任何内容: HTML: 我想得到div类“消息”和h4标记和跨越“日期时间”中的文本,我试图: 和: 但是他们没有成功。

  • 这是我试图解析的html: 我想得到

  • 我试图找到一种方法来获取div的值,但是我无法通过Xpath或CSSSelector找到元素。在这两种情况下(Xpath和cssSelector),Eclipse控制台都会显示错误消息: org.openqa.selenium.nosuchelementException:没有这样的元素:找不到元素:{“method”:“XPath”,“selector”:“//b[text()='protoco

  • 我需要提取以下html https://ndb.nal.usda.gov/ndb/search/list中列出的所有食品的ID和mfg.name 我正在使用Jsoup并且对它很陌生。

  • 我有如下的HTML电子邮件体。 我想获取emailBody中存在的每个元素(公司、优先级、描述等),最后生成Json键值对。 我希望通过使用JSOUP库我们能够实现这一点。 预期输出如下所示: 有人能帮我解决这个问题吗?

  • 我想解析出这个Nasa页面上的描述,页面底部的文字 我该怎么做?