jsoup是一个非常好用的html解析工具。使用时需要下载相应的jar包。
下面就是我使用jsoup解析html的表格的java源代码。
亲测可用!
public void parse(){ String htmlStr = "<table id=kbtable >" + "<tr> " + "<td width=123>" + "<div id=12>这里是要获取的数据1</div>" + "<div id=13>这里是要获取的数据2</div>" + "</td>" + "<td width=123>" + "<div id=12>这里是要获取的数据3</div>" + "<div id=13>这里是要获取的数据4</div>" + "</td> " + "</tr>" + "</table>"; Document doc = Jsoup.parse(htmlStr); // 根据id获取table Element table = doc.getElementById("kbtable"); // 使用选择器选择该table内所有的<tr> <tr/> Elements trs = table.select("tr"); //遍历该表格内的所有的<tr> <tr/> for (int i = 0; i < trs.size(); ++i) { // 获取一个tr Element tr = trs.get(i); // 获取该行的所有td节点 Elements tds = tr.select("td"); // 选择某一个td节点 for (int j = 0; j < tds.size(); ++j) { Element td = tds.get(j); // 获取td节点的所有div Elements divs = td.select("div"); // 选择一个div for (int k = 0; k < divs.size(); k++) { Element div = divs.get(k); //获取文本信息 String text = div.text(); //输出到控制台 System.out.println(text); } } } }
以上这篇使用jsoup解析html的table中的文本信息实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持小牛知识库。
我想解析出这个Nasa页面上的描述,页面底部的文字 我该怎么做?
本文向大家介绍Jsoup解析html实现招聘信息查询功能,包括了Jsoup解析html实现招聘信息查询功能的使用技巧和注意事项,需要的朋友参考一下 jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。 下面是招聘网站的html信息: 下面使
问题内容: 我正在做一个Maven项目,该项目使我可以解析网站中的html数据。我可以使用下面的代码来解析它: 到目前为止,我还没有问题。我可以解析html数据。我正在从jsoup中使用select方法,并使用“ div.col- section”检索数据,这意味着我正在使用class为col- section的div元素进行查找。我想在textarea中打印数据。即使网站上的实际数据超过一个段落
本文向大家介绍Java中使用开源库JSoup解析HTML文件实例,包括了Java中使用开源库JSoup解析HTML文件实例的使用技巧和注意事项,需要的朋友参考一下 HTML是WEB的核心,互联网中你看到的所有页面都是HTML,不管它们是由JavaScript,JSP,PHP,ASP或者是别的什么WEB技术动态生成的。你的浏览器会去解析HTML并替你去渲染它们。不过如果你需要自己在Java程序中解析
主要内容:Jsoup 使用DOM解析HTML 语法,Jsoup 使用DOM解析HTML 说明,Jsoup 使用DOM解析HTML 示例以下示例将展示在将 HTML 字符串解析为 Document 对象后如何使用类似 DOM 的方法。 Jsoup 使用DOM解析HTML 语法 document : 文档对象代表 HTML DOM。 Jsoup : 解析给定 HTML 字符串的主类。 html : HTML 字符串。 sampleDiv : 元素对象表示由 id“sampleDiv”标识的 html
主要内容:Jsoup 解析HTML正文 语法,Jsoup 解析HTML正文 说明,Jsoup 解析HTML正文 示例以下示例将展示将 HTML 片段字符串解析为 Element 对象作为 html 正文。 Jsoup 解析HTML正文 语法 document : 文档对象代表 HTML DOM。 Jsoup : 解析给定 HTML 字符串的主类。 html : HTML 片段字符串。 body : 表示文档正文元素的子元素,等效于 document.getElementsByTag("body"