现在提交答案已经很晚了,但是正确的检查方法是“rel”标签
public boolean checkFevicon() {
Elements e = doc.head().select("link[rel=shortcut icon]");
if (e.isEmpty()) {
return false;
} else {
return true;
}
}
jQuery等价物
$("link[rel='shortcut icon']")
正如Uwe Plonus在评论中指出的那样,你总是可以从
谷歌收藏
获取head元素上的文件名:
Connection con2=Jsoup.connect(url);
Document doc = con2.get();
Element e=doc.head().select("link[href~=.*\\.ico]").first();
String url=e.attr("href");
http://jsoup.org/cookbook/extracting-data/attributes-text-html
http://jsoup.org/cookbook/extracting-data/selector-syntax
问题内容: 我正在阅读Wikipedia上的Favicon页面。他们提到了Favicon的HTML 5规范: 当前的HTML5规范建议使用标签内的属性rel =“ icon” size =“以空格分隔的图标尺寸列表”,以多种尺寸指定尺寸图标。来源 ]可以通过将图标的内容类型以type =“ file content-type”的形式包含在图标中,来提供多种图标格式,包括诸如Microsoft .i
问题内容: 有没有一种方法可以从HTML文件中获取CSS类?示例片段: 完美的输出将是: 尽管这样可以: 问题答案: BeautifulSoup本身根本不解析CSS样式声明,但是您 可以 提取这些部分,然后使用专用的CSS解析器对其进行解析。 根据您的需求,有多个CSS解析器可用于python。我会选择cssutils(需要python 2.5或更高版本(包括python 3)),它在支持方面是最
在Spring,我找到了一个给定url的MockMVC: 太好了。现在我想看看这将返回的html是什么。我该怎么做?我想要它的字符串表示(即String theHtml=...),这样我就可以解析它并在我的测试中检查它。
所以我做了一个应用程序来存储所有用户喜欢的应用程序的快捷方式,有点像一个集线器。我可以支持实际的文件,我有一个<代码>。快捷方式的lnk解析器。我认为应用程序支持互联网快捷方式也是非常好的。这就是我正在做的: 假设我试图获取Google的图标(< code > http://www . Google . com/favicon . ico )。 > < li> 我首先去掉多余的页面(例如< cod
主要内容:Jsoup 获取HTML 语法,Jsoup 获取HTML 说明,Jsoup 获取HTML 示例以下示例将展示在将 HTML 字符串解析为 Document 对象后获取内部 html 和外部 html 的方法的使用。 Jsoup 获取HTML 语法 document :文档对象代表 HTML DOM。 Jsoup : 解析给定 HTML 字符串的主类。 html : HTML 字符串。 link : 元素对象表示表示锚标记的 html 节点元素。 link.outerHtml() : o
问题内容: 我使用WKWebView登录到一个网站,现在我想解析该网站的html。如何快速访问HTML网站?我知道它如何用于UIWebView但不适用于WKWebView。 谢谢你的帮助! 问题答案: 如果您等到页面加载完毕,则可以使用: 您还可以注入一些JavaScript,使您返回HTML。 您可以注入的javascript如下所示: