当前位置: 首页 > 知识库问答 >
问题:

JSOUP:-1加载URL时出错

姬坚成
2023-03-14

我想解析一个网站的一个段落。我想分析post div中的第一段:

我正在使用AsyncTask检索数据。这是doInBackground功能:

@Override
protected Elements doInBackground(String... url) {
    Document doc = null;
    try {
        doc = Jsoup.connect(url[0]).timeout(10*1000).get();
        return doc.select("div.post > p");
    } catch (Exception e) {
        e.printStackTrace();
    }
    return new Elements();
}

然而,我总是在Logcat中看到这一点:

java.io.:-1错误加载URLhttp://www.vaccinestoday.eu/diseases/disease/rabies/

在org。jsoup。帮手HttpConnection$响应。在org上执行(HttpConnection.java:414)。jsoup。帮手HttpConnection$响应。在org上执行(HttpConnection.java:391)。jsoup。帮手HttpConnection。在org上执行(HttpConnection.java:157)05-17。jsoup。帮手HttpConnection。在com上获取(HttpConnection.java:146)05-17。脱手。阿兹德。diseaseActivity$getDataTask。doInBackground(diseaseActivity.java:46)位于com。脱手。阿兹德。diseaseActivity$getDataTask。android上的doInBackground(diseaseActivity.java:1)。操作系统。异步任务$2。调用(AsyncTask.java:185)05-17 10:22:32.937:at java。util。同时发生的FutureTask$Sync。java上的innerRun(FutureTask.java:305)。util。同时发生的未来任务。在java上运行(FutureTask.java:137)05-17。util。同时发生的线程池执行器。java上的runWorker(ThreadPoolExecutor.java:1068)。util。同时发生的线程池执行器$Worker。在java上运行(ThreadPoolExecutor.java:561)。朗。丝线。运行(Thread.java:1096)

若你们点击链接,你们会看到你们可以正常打开它。这里有什么问题?

共有1个答案

颜文昌
2023-03-14

我运行了你的连接,运行得很好。关于你的问题,我不能这么说。它不会给你带来你想要的...所以我加强了它:

doc.select("div[class=post-entry] > p");
doc.select("div.post-entry > p");

其中任何一个基本上都会得到所有的职位。从现在开始,你可以继续单飞,不是吗?你还需要什么,尽管问。

 类似资料:
  • 我只是下载了最新版本的j汤(1.7.1)并遵循官方代码(更改了url)。然后我得到了“超文本传输协议错误获取url” 我的代码有什么问题?似乎错误只是发生在Android项目,因为我在一个工作正常的Java项目做同样的事情。 注意:-我已经添加了Internet权限

  • 线程“main”org.jsoup.HttpStatusException中出现异常:提取URL时出现HTTP错误。status=403,url=java Html解析器提取特定数据?在org.jsoup.helper.httpconnection$response.execute(httpconnection.java:590)在org.jsoup.helper.httpconnection$r

  • 我使用JSOUB清理所有网页,如下所示: 但我的问题是,代码一开始运行良好。 过一会儿,它会停止,总是给我“HTTP错误获取URL。状态=503错误”。 当我添加时。ignoreHttpErrors(true)它可以正常工作,但不会刮伤web。 *搜索词是我想要搜索的任何关键字,num是我需要检索的页数。 有人能帮忙吗?这是否意味着谷歌阻止了我的IP刮取?如果是的话,请问有什么解决方案或者我如何替

  • 我正在尝试从这里连接并检索页面标题。如果我从链接中删除“.com”之后的所有内容,代码运行良好。以下代码不起作用: 如果代码有效,返回的标题应该是“Sammamish Washington-Google News”。代码返回的错误是:“org.jsoup.HttpStatusException:HTTP错误获取URL。状态=405,URL=https://news.google.com/news/

  • 问题内容: 我一直有一些奇怪的问题。主要的问题是,在尝试将WSDL添加到新项目时,我始终收到以下错误: 这是error.log文件中记录的消息: 我验证了该URL上的应用程序已启动并正在运行,并且可以从Web浏览器访问WSDL,但是无论如何我始终会收到此错误消息。我在Windows 7机器上使用SoapUI 4.5.0(32位)。我也尝试了64位版本,但结果相同。无论我是否使用VPN,都会发生这种

  • 以下示例将展示使用url从Web获取HTML,然后查找其数据。 语法 (Syntax) String url = "http://www.google.com"; Document document = Jsoup.connect(url).get(); 哪里 document - document对象表示HTML DOM。 Jsoup - 连接url并获取HTML String的主类。 url