当前位置: 首页 > 面试题库 >

从UIWebView读取HTML内容

卫子平
2023-03-14
问题内容

是否可以读取已加载到中的网页的原始HTML内容UIWebView

如果不是,是否还有另一种方法可以从iPhone SDK中的网页中提取原始HTML内容(例如等效于.NET的内容WebClient::openRead)?


问题答案:

第二个问题实际上更容易回答。查看stringWithContentsOfURL:encoding:error:NSString的方法-它使您可以传入URL作为NSURL的实例(可以很容易地从NSString实例化),并在该URL返回包含页面完整内容的字符串。例如:

NSString *googleString = @"http://www.google.com";
NSURL *googleURL = [NSURL URLWithString:googleString];
NSError *error;
NSString *googlePage = [NSString stringWithContentsOfURL:googleURL 
                                                encoding:NSASCIIStringEncoding
                                                   error:&error];

运行此代码后,googlePage将包含www.google.com的HTML,error并将包含在提取过程中遇到的所有错误。(您应error在提取后检查的内容。)

换种方式(从UIWebView)比较麻烦,但是基本上是相同的概念。您必须从视图中拉出请求,然后像以前一样进行提取:

NSURL *requestURL = [[yourWebView request] URL];
NSError *error;
NSString *page = [NSString stringWithContentsOfURL:requestURL 
                                          encoding:NSASCIIStringEncoding
                                             error:&error];

编辑:
但是,这两种方法都会对性能造成影响,因为它们两次执行了请求。您可以通过使用其stringByEvaluatingJavascriptFromString:方法从当前加载的UIWebView中获取内容来解决此问题,如下所示:

NSString *html = [yourWebView stringByEvaluatingJavaScriptFromString: 
                                         @"document.body.innerHTML"];

这将使用文档对象模型获取视图的当前HTML内容,解析JavaScript,然后将其作为HTML的NSString *提供给您。

另一种方法是首先以编程方式执行您的请求,然后从您的请求中加载UIWebView。假设您举了上面的第二个示例,您在其中NSString*page调用了stringWithContentsOfURL:encoding:error:。然后,您可以使用将该字符串推送到Web视图中loadHTMLString:baseURL:,前提是您还保留了所请求的NSURL:

[yourWebView loadHTMLString:page baseURL:requestURL];

但是,我不确定这是否将运行您加载的页面中找到的JavaScript(方法名称loadHTMLString有点模棱两可,并且文档对此不多说)。



 类似资料:
  • 我有如下的HTML电子邮件体。 我想获取emailBody中存在的每个元素(公司、优先级、描述等),最后生成Json键值对。 我希望通过使用JSOUP库我们能够实现这一点。 预期输出如下所示: 有人能帮我解决这个问题吗?

  • 这是一个概念性的问题,因为我试图理解在react中处理表格数据的最佳方法,而不使用任何特殊组件或库。 我在子组件中动态创建的html表中有数据。数据来自父组件。有些列具有可编辑的内容,我通过“编辑”按钮触发这些内容,以重新呈现表格的一个版本,该版本包含可编辑列的所有行的内联文本框。 当我更改文本框的内容时,我希望能够单击“保存”按钮并保存所有行。 “保存”和“编辑”按钮不在表中内联,而是位于我的组

  • 问题内容: 我正在尝试使用Node.js从URL中读取内容,但似乎只有一堆字节。我显然做错了事,但不确定。这是我目前拥有的代码: 任何见识将不胜感激。 问题答案: 尝试使用客户端的on错误事件来查找问题。

  • 我试图创建一个简单的java程序,从zip文件中读取并提取文件内容。Zip文件包含3个文件(txt、pdf、docx)。我需要阅读所有这些文件的内容,为此我正在使用ApacheTika。 有人能帮我实现这个功能吗。到目前为止,我已经试过了,但没有成功 代码片段

  • 问题内容: 有一个库可以导出文件,但是我想捕获文件的内容。我想将一个作者传递到库中,并能够读取该作家写到文件中的内容。最终,我想扩充该库以跳过编写此文件的过程。io.Copy或io.Pipe是否可能? 库代码创建一个* File并将此句柄用作io.Writer。我尝试使用io.Copy,但只读取了0个字节。 问题答案: 如果要在写入字节时捕获字节,请使用带有的a 作为第二个写入器。 或在写入时在s

  • 问题内容: 当我写这篇文章时,我尝试使用Pandas处理大型CSV文件。 它会引发“ pandas.parser.CParserError:错误标记数据。C错误:内存不足” wc -l表示有13822117行,我需要在此csv文件数据帧上进行汇总,有没有办法处理其他然后拆分CSV成几个文件,并编写代码以合并结果?有什么建议吗?谢谢 输入是这样的: 所需的输出是这样的: 如果数据集较小,则可以使用下