当前位置: 首页 > 知识库问答 >
问题:

JSoup总是超时

丁学
2023-03-14

我正在尝试使用JSoup解析通过Servlet生成的HTML文件。据我所知,我需要申报一份文件。当我运行代码时

Document doc=Jsoup。解析(URL,10000);

它总是超时,如果我增加超时时间,它将一直运行,直到达到该时间。当我输入整数时。最大值,它只是永远运行。我在谷歌Chrome的macbook pro上工作。

我的问题是:

这只是我的电脑还是我做错了什么?

有没有一种方法可以解决这个问题,或者有一种方法可以完全不同地解析HTML页面?

共有1个答案

裴俊能
2023-03-14

替代解决方案

正如Jsoup的文档中所解释的,如果您有一个可访问的URL,那么您可以通过以下方式获取其内容:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();

如果字符串中包含HTML,则应该这样解析:

document = Jsoup.parse(htmlString);

如果本地文件中有HTML,则:

Document doc = Jsoup.parse(new File("FilePath"), "UTF-8", "http://example.com/");

您的解决方案您使用JSoup解析器的方式是正确的,但是问题在于link,也许如果您能提供有关它的详细信息,那么我们就可以找出问题所在。

确保Servlet生成的任何HTML都是可访问的,如果它是您的链接,那么它应该是指向该Servlet的URL

 类似资料:
  • 我有下面的代码行来获取一个html文档使用jSoup 无论我使用什么标题,这都会超时。相同的网址: 当我在Chrome或火狐上打卡时,工作完全正常。我错过了什么?提前感谢所有的帮助。

  • 问题内容: 我正在使用4.3版本的nodejs测试aws lambda。我能够在控制台测试中成功完成我的处理程序函数中的所有语句,其中包括连接到vpc中的mongodb主机。但是,该功能总是超时。我发现了一些帖子和资源,讨论了使用回调,在上下文中设置属性以及IAM角色权限,但是无论我做什么,它总是会超时。当前代码: 问题答案: 您有错别字: 应该: 这是文档中有关 callbackWaitsFor

  • 我想在应用程序启动时加载一些数据,这些数据将被所有活动使用。我在应用程序的onCreate方法中这样做,因为我希望在显示任何活动之前下载这些数据,所以我尝试使用RequestFuture发出同步请求。但是,始终会抛出TimeoutException。 什么是获得应用程序范围的数据的最佳方式,记住没有一个活动是首先启动的?

  • 我有一些代码,使用JSoup和连接到一个网站成功的Java。 我试图在Android上复制完全相同的东西(作为学习体验)。 我的JAVA代码中没有任何错误,并且已经确认它在JAVA(运行在Netbeans中)中仍然可以工作 我在libs文件夹中有我的JSoup jar~这是一个花了一点时间才找到的问题。 我已经放置了一些edittext.settext(“here”);查看代码的位置。 我试过这两

  • 我正在开发一个图像抓取器,它使用JSOUP抓取各种子reddit的第一页。然而,出现的问题是,当试图抓取NSFW子reddit时,reddit重定向到超过18个身份验证页面,而抓取程序则抓取身份验证页面。我是刮擦的新手,并且理解这是一个新手问题,但任何帮助将不胜感激,因为我完全迷失了。

  • 我有以下2个类 然后运行 或 始终给予 为什么会出现这种情况?乍一看,在这两种场景中,我都假设只调用构造函数,因此唯一的输出是 但这显然是错误的。