我已经成功地在一个分隔符中获取了如下所示的文本:
使用此选项:
Document doc = Jsoup.connect("https://" + line).userAgent("Mozilla/17.0").get();
String goal = doc.select("div._6wae").html();
所以我知道我的方法可以在分隔符中查找文本,但我不确定如何在分隔符中查找跨度内的文本。
非常感谢!
这应该做到:
Document doc = Jsoup.parse("<div class=_6wab><span>$35 raised</span></div><p><span>hi</span></p>");
//use css selectors
Elements rows = doc.select("div._6wab span");
System.out.println(rows.eachText());
产出:
[$35 raised]
注:仅打印div范围内的文本。此外,如果HTML中不存在该类,则不会引发任何NullPointerException
。在这种情况下,将返回一个空列表。这还将捕获具有给定类的div中的所有跨度。
这段代码可能有效。
首先,找到类为“6wab”的第一个div。
Element div = doc.getElementsByClass("_6wab").first();
然后,在得到div之后,找到内部跨度。
Element span = div.select("span").first();
最后,获取文本。
System.out.println(span.text());
我试图从这些div标签中获取文本,但是它们都不返回任何内容: HTML: 我想得到div类“消息”和h4标记和跨越“日期时间”中的文本,我试图: 和: 但是他们没有成功。
这是我试图解析的html: 我想得到
我试图找到一种方法来获取div的值,但是我无法通过Xpath或CSSSelector找到元素。在这两种情况下(Xpath和cssSelector),Eclipse控制台都会显示错误消息: org.openqa.selenium.nosuchelementException:没有这样的元素:找不到元素:{“method”:“XPath”,“selector”:“//b[text()='protoco
我需要提取以下html https://ndb.nal.usda.gov/ndb/search/list中列出的所有食品的ID和mfg.name 我正在使用Jsoup并且对它很陌生。
我有如下的HTML电子邮件体。 我想获取emailBody中存在的每个元素(公司、优先级、描述等),最后生成Json键值对。 我希望通过使用JSOUP库我们能够实现这一点。 预期输出如下所示: 有人能帮我解决这个问题吗?
我想解析出这个Nasa页面上的描述,页面底部的文字 我该怎么做?