当前位置：首页 > 软件库 > Web应用开发 > HTML解析器 >

jsoup

HTML 解析器

授权协议 MIT

开发语言 Java

所属分类 Web应用开发、 HTML解析器

软件类型开源软件

地区不详

投递者咸晨

操作系统跨平台

开源组织无

适用人群未知

软件官网

软件文档

官方下载

软件概览

jsoup 是一款 Java 的 HTML 解析器，可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API，可通过 DOM、CSS 以及类似于 JQuery 的操作方法来取出和操作数据。

本站使用 jsoup 来解析 HTML。

jsoup的主要功能如下：

从一个URL，文件或字符串中解析HTML；
使用DOM或CSS选择器来查找、取出数据；
可操作HTML元素、属性、文本；

jsoup是基于MIT协议发布的，可放心使用于商业项目。

示例代码：

File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");

Element content = doc.getElementById("content");
Elements links = content.getElementsByTag("a");
for (Element link : links) {
  String linkHref = link.attr("href");
  String linkText = link.text();
}

在线Javadoc：http://tool.oschina.net/apidocs/apidoc?api=jsoup-1.6.3

使用案例

jsoup 使用教程

jsoup是一款Java的html解析工具，主要是对html和xml文件进行解析在写爬虫的时候，当我们用HttpClient之类的框架，得到目标网页的源码后，需要从网页源码中取得我们想要的内容。就可以使用jsoup轻松获取想要的内容。 jsoup的中文开发文档获取jsoup的maven方式 <dependency> <groupId>org.jsoup</groupId> <a

相关资料

Java DOM4J解析器解析XML文档

主要内容：Java DOM4J解析器解析XML文档的步骤,Java DOM4J解析器解析XML文档的示例Java DOM4J解析器解析XML文档的步骤以下是使用 DOM4J Parser 解析文档时使用的步骤。导入与 XML 相关的包。创建一个 SAXReader。从文件或流创建文档。通过调用 document.selectNodes() 使用 XPath 表达式获取所需的节点提取根元素。迭代节点列表。检查属性。检查子元素。导入 XML 相关的包创建一个文档生成器从
Java XPath解析器解析XML文档

主要内容：Java XPath解析器解析XML文档的步骤,Java XPath解析器解析XML文档的示例Java XPath解析器解析XML文档的步骤以下是使用 XPath Parser 解析文档时使用的步骤。导入与 XML 相关的包。创建一个文档生成器。从文件或流创建文档。创建一个 Xpath 对象和一个 XPath 路径表达式。使用XPath.compile()编译 XPath 表达式，并通过XPath.evaluate()评估编译的表达式来获取节点列表。迭代节点列表。
Java StAX解析器解析XML文档

主要内容：Java StAX解析器解析XML文档的示例Java StAX解析器解析XML文档的示例需要解析的文件input.xml 编写Java StAX解析器解析XML文档的程序输出结果为：
Java JDOM解析器解析XML文档

主要内容：Java JDOM解析器解析XML文档的步骤,Java JDOM解析器解析XML文档的示例Java JDOM解析器解析XML文档的步骤以下是使用 JDOM解析器解析文档时使用的步骤。导入与 XML 相关的包。创建一个文档生成器。从文件或流创建文档提取根元素检查属性检查子元素导入 XML 相关的包创建一个文档生成器从文件或流创建文档提取根元素检查属性检查子元素 Java JDOM解析器解析XML文档的示例 input.xml文件： JDomParser
Java SAX解析器解析XML文档

主要内容：Java SAX解析器解析XML文档的示例Java SAX解析器解析XML文档的示例需要解析的文件input.xml 编写DefaultHandler的事件处理程序编写核心解析处理类输出结果为：
Java DOM解析器解析XML文档

主要内容：Java DOM解析器解析XML文档的步骤,Java DOM解析器解析XML文档的示例Java DOM解析器解析XML文档的步骤以下是使用 DOM解析器解析文档时使用的步骤。导入与 XML 相关的包。创建一个文档生成器。从文件或流创建文档提取根元素检查属性检查子元素导入 XML 相关的包创建一个文档生成器从文件或流创建文档提取根元素检查属性检查子元素 Java DOM解析器解析XML文档的示例项目结构如下： input.xml文件： DomPars
源码解析 - dashboard解析

plugins/kibana/public/dashboard/index.js 结构跟 visualize 类似，设置两个调用 savedDashboards.get() 方法的 routes，提供一个叫 dashboard-app 的 directive。 savedDashboards 由 plugins/kibana/public/dashboard/services/saved_dash
源码解析 - visualize解析

index.js 中，首要当然是注册自己。此外，还加载两部分功能：plugins/kibana/visualize/editor/* 和 plugins/kibana/visualize/wizard/wizard.js。然后定义了一个 route，默认跳转 /visualize 到 /visualize/step/1。 editor editor.js 中也定义了两个 route，分别是 /vi

jsoup

同类工具

相关阅读

相关文章

相关问答

相关文档