我在我的Jsoup项目中有这个有线senario
<html>
..
<link> example.com </link>
..
</html>
System.out.println(document.select("link").text()) ;//nothing gets printed. (it should print **example.com**)
<html>
..
<someOtherTage> example.com </someOtherTage>
..
</html>
System.out.println(document.select("someOtherTage").text()); //prints **example.com**
这是jsoup
中的一个bug,还是标记名“link
”有什么特殊的地方?
注意:Jsoup版本使用了1.6和1.9。Java 7和8
由于link
元素是一个空元素,所以JSoup对该元素进行了清理,并将其内容移到了正文中。(通过打印文档来验证这一点)。
要保留link元素中的内容,请切换到XML解析模式:
Document doc = Jsoup.parse(html, "", Parser.xmlParser());
问题内容: 我想将jsoup解析为utf -8,但我不能。我尝试了我所知道的一切,然后在Google上进行了搜索。 我的目标是: 但是 不是。 请帮忙 问题答案: 淘汰 你好世界Öçasasa
(下的唯一div) 还有更多关于参数的... 我也给了任何其他标签一个镜头,但我得到同样的问题。 最接近成功的是:。这将返回所有视频标题。但可悲的是,也有一些与其他文本的其他链接。因此不可靠。 下面是实现JSOUP的代码: 我尝试提取的示例:我正在查找的HTML块的图像 我好像错过了很多人说Jsoup很棒很简单的东西...(在我的情况下不是:v)
为什么我无法解析符号“r”..??。当我在这个.class文件上创建新活动时,我会遇到一个问题,为什么我不知道在创建类之后我什么也没做。(在R.Layout.Dashboard中)。(“红色R”)。 请帮帮我.
问题内容: 我无法使用Jsoup库从此处获取div 。 这是我的代码: 问题答案: 此标记中的文本不是初始html的一部分,而是在页面加载后由JavaScript设置的。您可以通过在浏览器中禁用JavaScript进行检查。Jsoup仅获取静态html,不执行JavaScript代码。 当您检查从页面建立的连接时,您会发现该值是通过对此API的请求进行更新的: https://shapeshift
我想解析一个HTML表,但我不明白如何获得值。我有这张桌子: 你能为我杀一儆百吗?我要分析此表得所有值...提前谢谢! 编辑:SPAN值:
但是当我使用Java8时, 它抛出 java.time.format.DateTimeParseException:无法分析文本“201510”:无法从TemporalAccessor获取LocalDate:{Year=2015,MontHofYear=10},ISO类型为java.time.Format.Parsed