当前位置：首页 > 软件库 > iOS代码库 > 网页(Webview) >

解析html网页的数据

授权协议 Public Domain

开发语言 Objective-C

所属分类 iOS代码库、网页(Webview)

软件类型未知

地区国产

投递者拓拔弘化

操作系统 iOS

开源组织无

适用人群未知

软件官网

官方下载

软件概览

用于解析html网页数据。
作者说：ZHParseHtmlData这个类是我自己写的，解析html的。发现之前用过的TFHpple还有许多都有问题，有的GB2312或者其他编码会乱码或者是不规范的Xml或者不规范的html都解析不出来。现在用我这个类让浏览器对之前页面优化再解析就可以了，只要解析的类是GDataXMLNode，谷歌的东西。也可以用JS解析，但是那样太麻烦，为何不拿着谷歌现有的用呢。
Common.h这个是我写的一个公共方法类，为了方便就拿过来了。
用的时候对于谷歌的类要添加libxml2.2.dylib和在 build setting>header search paths添加/usr/include/libxml2
对于svp，我们要添加QuartzCore.framework这个库。如果使用ARC，请在pases声明这个类不用ARC -fobjc-arc
使用方法： LOADING_DATA_FORM_HTML(stringUrl, pathArray);
stringUrl是解析的网页地址
pathArray 是解析xpath表达式数组
//下面实在pch里面定义的解析方法，方便自己使用。
#define LOADING_DATA_FORM_HTML(hostString,pathArr)
ZHParseHtmlData *viewController=[[ZHParseHtmlData alloc] init];
viewController.ADelegate=self;
viewController.hostUrl=hostString;
if(pathArr.count>0)
{
viewController.pathArray=pathArr;
}
else if(pathArray.count==1)
{
viewController.pathString=pathArr[0];
}
[viewController loadHtmlData:self.view];
-(void)returnHtmlData:(NSMutableArray *)arr VC:(ZHParseHtmlData *)VC
这个是回调函数，arr是一个大数组，patharray几个元素，这个arr几个元素，每一个元素又是一个大数组，每一个元素对差找到的元素。每一个元素里面是一个字典，字典包含了这个元素所包含的元素，键值是对应元素的atrrbute(单词可能写错了)，stringValue是这个元素在网页显示的内容。
进行下一步必须要把ZHParseHtmlData这个页面去掉：
[VC removeFromSuperview];
可能还有一些bug，但是总体来说解析还是没问题的。有什么问题和BUG可以私信我。 [Code4App.com]

使用案例

通过HTML页面解析JSON数据

我得到JSON格式的字符串，我想将其发送到配置文件的.html 我的问题是如何保存的字符串，并与我从JSON获取变量解析它，给profile.html页面，因为我需要从页面到页面的会话和user_id变量。当我调试时，debuger说'user_id'没有定义; 感谢的很多通过HTML页面解析JSON数据 enter code here gloabl variables are User_id,
HTML文本解析

HTML文本解析一、Xpath解析数据 1、解析库lxml安装（1）windows下安装： pip install lxml 如果没有报错，说明安装成功。如果出错，例如：提示缺少libxml2，则可以采用wheel方式安装。可以到以下链接下载对应wheel（网址：http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml），找到与Python版本和系统对
c# 解析html网页 获取某个节点的内容

首先添加 HtmlAgilityPack.dll引用 private void JieXiHTML(string htmlURL) { WirteLog("加载网页内容 -- 开始"); HtmlWeb webClient = new HtmlWeb(); HtmlAgilityPack.HtmlDocume
使用Beautiful Soup库解析网页

使用Beautiful Soup库解析网页 Beautiful Soup是一个可以从HTML或XML文件中提取数据的Python库。它能够实现惯用的文档导航，查找，修改文档的方式等功能。Beautiful Soup支持Python标准库中的HTML解析器，还支持一些第三方的解析器，其中一个是 lxml，另一个可供选择的解析器是纯Python实现的 html5lib，html5lib的解析方式与浏览
html网页显示excel表格数据-html读取本地excel文件并展示

html读取本地excel文件并展示 ①首先单击浏览器上的“文件”抄里面“另存为”，然后将保存类型选为“htm 或是 html”格式； ②然后打开Excel，新建一个空白表格；单击菜单上的“数据”-->导入外部数据-->导入数据； ③找到刚才保存的“Html”单击打开，再单击“导入”，在弹出的“导入数据”窗口中你可以选择“现有工作表”、“新建工作表”都行，然后单击确定即可。提示：有些朋友在Htm
头歌Beautifulsoup解析网页

import requests from bs4 import BeautifulSoup def get_data(url, headers): ''' 两个参数 :param url:统一资源定位符,请求网址 :param headers:请求头 :return data:list类型的所有古诗内容 ''' # *************

解析html网页的数据

同类工具

相关阅读

相关文章

相关问答

相关文档