当前位置: 首页 > 知识库问答 >
问题:

HtmlUnit解析“http://www.ean-search.org/sitemap.html”,返回404

仉昂熙
2023-03-14

PS:我的webclient代码:

myWebClient = new WebClient(BrowserVersion.FIREFOX_3_6); 
myWebClient.setIncorrectnessListener(new CustomizedInconnectnessListener());
myWebClient.setTimeout(180000); //3 min, used twice, first for connection, second for retrieval
try {
    myWebClient.setUseInsecureSSL(true);
} catch (GeneralSecurityException ex) {
    logger.log(Level.SEVERE, "cannot set UseInsecureSSL for BNP webclient",ex);
            //ignore it, continue
}

myWebClient.setRedirectEnabled(true); 
myWebClient.setCssEnabled(false); 
myWebClient.setJavaScriptTimeout(30000); //timeout for executing java script
myWebClient.setThrowExceptionOnScriptError(false);

HtmlPage htmlpage = (HtmlPage) myWebClient.getHtmlPage("http://www.ean-search.org/sitemap.html");
myWebClient.waitForBackgroundJavaScriptStartingBefore(3000);
Thread.sleep(3000);
System.out.println(htmlpage.asXml());

共有1个答案

锺离刚洁
2023-03-14

你用的代码看起来很糟糕。我收到了很多错误和警告...甚至不可能编译它。例如mywebclient.gethtmlpage应该是mywebclient.getpage

这段代码适用于我,并输出页面的内容:

WebClient myWebClient = new WebClient(BrowserVersion.FIREFOX_17);
HtmlPage page = myWebClient.getPage("http://www.ean-search.org/sitemap.html");
System.out.println(page.asXml());

确保使用最新的HtmlUnit库,并在编译器告诉您某些内容被弃用时注意它。不建议使用这些方法和字段。

 类似资料:
  • 更新时间:2019-05-30 13:49:05 节点简介 HTTP返回节点是一个对外输出API的结束节点,你可以通过它配置API的返回值 (注意:“HTTP请求”节点与“HTTP返回”节点必须成对出现)。每个API有且仅有一个HTTP返回节点 , 默认返回前置节点输出。 使用场景 如果您需要使用服务开发工作台开发出一个http接口,那么您就需要使用HTTP请求节点作为起始节点,HTTP返回节点作

  • 问题内容: 我想解析网页http://dcsd.nutrislice.com/menu/meadow- view/lunch/ 以获取今天的午餐菜单。(我已经构建了Adafruit #IoT热敏打印机,并且希望每天自动打印菜单。) 我最初使用BeautifulSoup来解决这个问题,但事实证明,大多数数据都已加载到JavaScript中,并且我不确定BeautifulSoup是否可以处理它。如果您

  • 我正在从Go中的YAML输入创建一个文档生成器。它需要指定每个项目/节点是从YAML文件的哪一行生成的。有没有办法在Go中实现? 例如,这是一个YAML文件 我希望看到以下内容 我看到一个类似的问题回答了Python解析YAML,返回行号,但我不知道如何利用https://pkg.go.dev/gopkg.in/yaml.v3

  • 问题内容: 我正在尝试加载具有获取Google Map脚本功能的两个脚本,然后在加载后,我获得另一个脚本(),该脚本使Map applet易于制作。 但是,加载后,获取Google Map API的第一个脚本很好,然后第二个脚本返回解析错误并显示以下内容: TypeError:’undefined’不是构造函数’ 但是,我不知道从哪里引用或从哪一行引用,我认为它一定是试图在此文件上执行Geocod

  • 我在Springboot应用程序日志中发现了这样的错误消息: 我知道,这可能是因为有人/某个应用程序使用HTTPS而不是HTTP调用我的endpoint。我可以通过在属性中包含以下内容来记录这些请求: 现在,我收到了未分析的文本,如下所示: 是否可以对其进行解码/解密,并找出实际的API调用是什么?

  • 主要内容:前记,1.如何封装为ModelAndView,2.视图解析原理,3.视图解析的过程前记 根据上文中的返回值解析器会根据不同的返回值解析器去解析成不同的返回值, 但是最后返回值会封装为ModelAndView。本篇的内容就是如何去封装为ModelAndView, 以及如何根据ModelAndView转为View, 最后渲染为真正的视图。 1.如何封装为ModelAndView DispatcherServlet.doDispatcher -> ha.handler() -> Re