当前位置: 首页 > 软件库 > Web应用开发 > HTML解析器 >

Jericho

HTML 解析器
授权协议 LGPL
开发语言 Java
所属分类 Web应用开发、 HTML解析器
软件类型 开源软件
地区 不详
投 递 者 和飞翔
操作系统 跨平台
开源组织
适用人群 未知
 软件概览

Jericho HTML解析器是一个Java库,以分析和操纵部分的HTML文件,其中包括服务器端的标签,而过滤掉任何无法识别的或无效的HTML 。它也提供高层次的HTML表单操作函数。

示例代码:

import net.htmlparser.jericho.*;
import java.util.*;
import java.io.*;
import java.net.*;

public class Encoding {
public static void main(String[] args) throws Exception {
String sourceUrlString="data/test.html";
if (args.length==0)
System.err.println("Using default argument of \""+sourceUrlString+'"');
else
sourceUrlString=args[0];
if (sourceUrlString.indexOf(':')==-1) sourceUrlString="file:"+sourceUrlString;
System.out.println("\nSource URL:");
System.out.println(sourceUrlString);
URL url=new URL(sourceUrlString);
Source source=new Source(url);
System.out.println("\nDocument Title:");
Element titleElement=source.getFirstElement(HTMLElementName.TITLE);
System.out.println(titleElement!=null ? titleElement.getContent().toString() : "(none)");
System.out.println("\nSource.getEncoding():");
System.out.println(source.getEncoding());
System.out.println("\nSource.getEncodingSpecificationInfo():");
System.out.println(source.getEncodingSpecificationInfo());
System.out.println("\nSource.getPreliminaryEncodingInfo():");
System.out.println(source.getPreliminaryEncodingInfo());
}
}
  • 原部分来自Internet上的其他博客,只是因为很长一段时间。忘了谁是参考,这里说声抱歉。。 先贴一些html页: <html> <head> <meta http-equiv="content-type" content="text/html;charset=GBK"> <title>HTML Parser</title> <meta name="generator" content="Namo

  • Jericho Html paser详解 Jericho Html parseAPI: http://jericho.htmlparser.net/docs/javadoc/index.html   1:Source 在解析Html文档中第一步就是创建一个Source对象,该对象的构造方法如下: Source(java.lang.CharSequence text)            Cons

  •         今天注册了我在CSDN的学习博客,我将会在这里记录自己在嵌入式学习这条大道上前进的点点滴滴,并不断鼓励自己努力,坚持,忍耐,要在嵌入式领域里干出点成绩!!!!! 

  • Jericho HTML解析器是一个Java库,以分析和操纵部分的HTML文件,其中包括服务器端的标签,而过滤掉任何无法识别的或无效的HTML 。它也提供高层次的HTML表单操作函数。 http://www.oschina.net/action/project/go?id=8344&p=download 示例代码: import net.htmlparser.jericho.*; import j

  • Jericho HTML Parser是一个简单而功能强大的Java HTML解析器库,可以分析和处理HTML文档的一部分,包括一些通用的服务器端标签,同时也可以重新生成无法识别的或无效的HTML。它也提供了一个有 用的HTML表单分析器。 下载地址:http://sourceforge.net/project/showfiles.php?group_id=101067 HttpClient作为H

  • 通过jericho获取网页编码 public class MyParser { /** * 通过parser解析页面 * @param parserSource 要被解析的网页源文件 */ public void parserSource(String parserSource) { Source source = new Source(parserSource);

  • <span style="font-size:18px;">public static void main(String[] args) throws ClientProtocolException, IOException { CloseableHttpClient client = HttpClients.createDefault(); HttpGet get = new HttpG

  • import net.htmlparser.jericho.Element; import net.htmlparser.jericho.HTMLElementName; import net.htmlparser.jericho.Source; import java.io.File; import java.io.IOException; public class HtmlBeanUtil {

  • 一晚上搜索 JTidy,html parser,hotSax,结果还是 jericho html parser 好用。除了包名起得很长以外。 以后html可以随意解析了。

  • 此文是对上一篇qq申请器的一个小完善,主要是解决当html数据被抓取后如何进行操作的问题 package bipt.com.qqapaly; import java.util.List; import net.htmlparser.jericho.*; public class FindNumber {     Source source;     List<Element> element;  

  • 1.使用htmlparser.jericho方法来实现 2.通过列和行来定位表格元素。获取表格元素 3.可以获取所有的表格。 4.对于表格嵌套的话,可能还需要做相应更改 package com.fresheggs.web; import java.io.IOException; import java.net.MalformedURLException; import java.net.URL;

 相关资料
  • 主要内容:Java DOM4J解析器 解析XML文档的步骤,Java DOM4J解析器 解析XML文档的示例Java DOM4J解析器 解析XML文档的步骤 以下是使用 DOM4J Parser 解析文档时使用的步骤。 导入与 XML 相关的包。 创建一个 SAXReader。 从文件或流创建文档。 通过调用 document.selectNodes() 使用 XPath 表达式获取所需的节点 提取根元素。 迭代节点列表。 检查属性。 检查子元素。 导入 XML 相关的包 创建一个文档生成器 从

  • 主要内容:Java XPath解析器 解析XML文档的步骤,Java XPath解析器 解析XML文档的示例Java XPath解析器 解析XML文档的步骤 以下是使用 XPath Parser 解析文档时使用的步骤。 导入与 XML 相关的包。 创建一个文档生成器。 从文件或流创建文档。 创建一个 Xpath 对象和一个 XPath 路径表达式。 使用XPath.compile()编译 XPath 表达式,并通过XPath.evaluate()评估编译的表达式来获取节点列表。 迭代节点列表。

  • 主要内容:Java StAX解析器 解析XML文档的示例Java StAX解析器 解析XML文档的示例 需要解析的文件input.xml 编写Java StAX解析器 解析XML文档的程序 输出结果为:

  • 主要内容:Java JDOM解析器 解析XML文档的步骤,Java JDOM解析器 解析XML文档的示例Java JDOM解析器 解析XML文档的步骤 以下是使用 JDOM解析器 解析文档时使用的步骤。 导入与 XML 相关的包。 创建一个文档生成器。 从文件或流创建文档 提取根元素 检查属性 检查子元素 导入 XML 相关的包 创建一个文档生成器 从文件或流创建文档 提取根元素 检查属性 检查子元素 Java JDOM解析器 解析XML文档的示例 input.xml文件: JDomParser

  • 主要内容:Java SAX解析器 解析XML文档的示例Java SAX解析器 解析XML文档的示例 需要解析的文件input.xml 编写DefaultHandler的事件处理程序 编写核心解析处理类 输出结果为:

  • 主要内容:Java DOM解析器 解析XML文档的步骤,Java DOM解析器 解析XML文档的示例Java DOM解析器 解析XML文档的步骤 以下是使用 DOM解析器 解析文档时使用的步骤。 导入与 XML 相关的包。 创建一个文档生成器。 从文件或流创建文档 提取根元素 检查属性 检查子元素 导入 XML 相关的包 创建一个文档生成器 从文件或流创建文档 提取根元素 检查属性 检查子元素 Java DOM解析器 解析XML文档的示例 项目结构如下: input.xml文件: DomPars

  • plugins/kibana/public/dashboard/index.js 结构跟 visualize 类似,设置两个调用 savedDashboards.get() 方法的 routes,提供一个叫 dashboard-app 的 directive。 savedDashboards 由 plugins/kibana/public/dashboard/services/saved_dash

  • index.js 中,首要当然是注册自己。此外,还加载两部分功能:plugins/kibana/visualize/editor/* 和 plugins/kibana/visualize/wizard/wizard.js。然后定义了一个 route,默认跳转 /visualize 到 /visualize/step/1。 editor editor.js 中也定义了两个 route,分别是 /vi