当前位置: 首页 > 知识库问答 >
问题:

HtmlUnit网页状态代码

苗烈
2023-03-14
int status= webClient.getPage("website").getWebResponse().getStatusCode();
System.out.println( status);

共有1个答案

柯立果
2023-03-14

据此

您可以这样做:

webclient.setThrowExceptionOnFailingStatusCode(False)

****编辑***

 WebClient webClient = new WebClient();
 webClient.setThrowExceptionOnFailingStatusCode(false);
 int status = webClient.getPage("http://google.co.uk/ffffff").getWebResponse()
            .getStatusCode();
 System.out.println(status);
 类似资料:
  • 使用指南 - 账户管理 - 站点管理 - 首页代码状态的意义 统计自动对网站首页代码进行检查,新建站点的状态是“未发起检查”,可手动刷新状态。百度统计会按照用户提供的网站首页地址,通过请求回的结果判断首页代码的安装情况 首页代码检查状态总共包括6个状态: 1. 代码安装正确 若该网站首页有多套代码,将告知其他代码的来源站点。 2. 未检测到代码 提示信息:该页面无任何百度统计代码请求,请按要求安装

  • 我想在不使用应用编程接口的情况下访问instagram页面。我需要找到追随者的数量,所以这不仅仅是一个源下载,因为页面是动态构建的。 我发现HtmlUnit是一个模拟浏览器的库,这样JS就会被渲染,我就能得到想要的内容。 但是,此调用会导致以下异常: 所以它无法访问该脚本,但如果我正确解释了这一点,它只是为了加载字体,我不需要。我在google上搜索了如何告诉它忽略页面的某些部分,并找到了这条线索

  • 已解决 通过使用HTMLUnit并在打印页面前停止一段时间,我让它打印缺少的内容

  • 主要内容:静态网页,动态网页本节我们了解一下静态网页和动态网页的相关概念。如果您熟悉前端语言的话,那么您可以快速地了解本节知识。 当我们在编写一个爬虫程序前,首先要明确待爬取的页面是静态的,还是动态的,只有确定了页面类型,才方便后续对网页进行分析和程序编写。对于不同的网页类型,编写爬虫程序时所使用的方法也不尽相同。 静态网页 静态网页是标准的 HTML 文件,通过 GET 请求方法可以直接获取,文件的扩展名是 、 等,网面中

  • jd.getNetworkType(OBJECT) 获取网络类型。 OBJECT 参数说明: 参数 类型 必填 说明 success Function 是 接口调用成功的回调 fail Function 否 接口调用失败的回调函数 complete Function 否 接口调用结束的回调函数(调用成功、失败都会执行) success 回调参数说明: 参数 说明 networkType 网络类型

  • 我正在设计一个类似API的REST,用于基于YUI的客户端的分页数据检索。对于 GET 请求,REST 网址如下所示: 所有参数都是可选的,即如果未给定参数,则将转储数据库中的所有数据。现在假设数据库中只有1000条记录。提出以下要求: 如果来自数据库的分页结果仍然为空,尽管请求正常,我应该返回什么状态代码?!我无法确定这是