当前位置: 首页 > 知识库问答 >
问题:

Jsoup返回404错误

鱼意远
2023-03-14

JSoup-1.8.1

尝试{
Document Document=Jsoup.connect(url.get();
返回Document.getElementsByTag(“title”).text();
}catch(异常e){
System.out.println(e);
返回null;
}

org.jsoup.HttpStatusExc0019: HTTP错误获取URL。状态=404, URL=http://ja.wikipedia.org/wiki/

解码的url在这里http://ja.wikipedia.org/wiki/りんご

当我在本地的Main函数中运行它时,它会按我期望的方式运行。但是如果我在Servlet中执行它,它返回404错误。非编码url可以正确执行。

共有1个答案

毕胡非
2023-03-14

维基百科不允许机器人爬网添加useragentreferer

doc = Jsoup.connect(url)
      .userAgent("Mozilla/5.0 (Windows; U; WindowsNT 5.1; en-US; rv1.8.1.6) Gecko/20070725 Firefox/2.0.0.6")
      .referrer("http://www.google.com")
      .get();
 类似资料:
  • 这是我的控制器,它将请求映射到以下url

  • 我试图获得一个Spring Boot(1.5.9)项目,以响应一个简单的Hello world消息。但是,我发送的任何请求都会立即返回404异常。 MyBackEndApplication 控制器/指挥机 Build.Gradle 当请求一个页面()时,我得到一个404错误。以下信息显示在此请求的日志中(这里有一个要点,因为我不喜欢将其格式化为引号的方式): 2018-02-05 13:01:37

  • 我编写了controller,它为每个映射使用了不同的值。现在我将它简化为对所有映射使用相同的值,但是我不知道如何使test工作,因为它在每个映射上都返回404。 这里是我的控制器: 和我的测试: 404及以下所有测试结果: 在org.springframework.test.util.assertionerrors.fail(assertionerrors.java:59)在org.spring

  • 我是新来的Laravel使用本地开发环境与家园尝试运行简单的测试 路由/网络。php: 运行phpunit返回404错误 vagrant@homestead:~/code/laravel$phpunit phpunit 6.4。3由塞巴斯蒂安·伯格曼和撰稿人撰写。 .F.3/3(100%) 时间:1.07秒,内存:10.00MB 有1次失败: 1) Tests\Feature\UserTest::

  • 我正在开发SpringCloudStream的Brooklyn.Release版本。我的用例具有多个接收器的HttpSource。当我将初学者应用程序依赖项添加到应用程序中并使用它时,如下所示: 我的聚合应用程序是 一直得到如下响应:

  • 我想在我的应用程序中实现对Jersey Rest/JSON的JUnit测试。 我的问题是我得到一个404没有找到从灰熊。但是路径是正确的,并且在普通Webcontainer上使用Curl的测试是正常的。 Eclipse Indigo(在Windows 7上) asm-3.3.1.jar Jerse-Client-1.12.jar 球衣-核心-1.12.jar jerse-json-1.12.jar