当前位置: 首页 > 知识库问答 >
问题:

无法使用Jsoup获取数据

郭永安
2023-03-14

我是新来的JSoup和学习它我想从Imdb站点/特定的电影链接提取评级,并发现我将能够从div与class=star-box-细节,因此我写了以下内容代码:

public static void main(String [] args)
{
    try {
        Elements data;
        String userAgent = "ExampleBot 1.0 (+http://example.com/bot)";
        String url = "http://www.imdb.com/title/tt0114746/";
        data =  Jsoup.connect(url).userAgent(userAgent).get().select("div.star-box-details").select("[href]");
        System.out.println(data);
    } catch (IOException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }
}

很奇怪,我没有得到任何数据,因为我能够在几周前得到评级数据。是div与class=star-box-细节存在于页面/url上。

共有1个答案

通博实
2023-03-14

该特定的用户代理可能被阻止内容返回的站点过滤。你可以用

String userAgent = "Mozilla/5.0 (Windows; U; WindowsNT 5.1; en-US; rv1.8.1.6) Gecko/20070725 Firefox/2.0.0.6";
 类似资料:
  • 尝试使用Jsoup而不是网站API从网站上练习和获取信息。我的代码没有错误,但文本字段没有更改。它只是给我一个空白。我如何从网站上获取信息?我正试图获取主要新闻,以便在我的网站上发布。 我的代码:

  • 我正在使用java从BNN网站上简单地跟踪股票的变化,我已经将其全部设置为访问正确的值。然而,我得到的不是一个数值,而是。如何访问网站上显示的数值? 此外,如果你能帮我得到这个网站上的当前值,那也会很有帮助。 //编辑// 我更新了我的代码,但现在输出只有2,它只是从{{quoteObj.high|Number: 2}}中获取数字,我希望在网站上显示实际的数字值。 我已经附上了一个网页的图像和ht

  • 我正在为Java开发人员使用最新的Eclipse IDE中的最新jsoup(1.13.1)(包括孵化组件)版本:2020-09(4.17.0)构建ID:20200910-1200。 我试图解析一个非常具体的网站,但没有成功。在我执行这些行之后:doc=jsoup.connect(“http://pokehb.pw/%d7%a2%d7%95%d7%a0%d7%94/21/%d7%a4%d7%a8%d

  • 我正在尝试用JSOUP从以下页面获取内容:

  • 所以我尝试从pretag获取数据,我设置doc连接到url选择pretag,结果出错了,我需要获取的数据按这里

  • 我有一些url。我想从url指向的html中获取所有href,从所有获取的hrefs中获取所有href(递归)。关键是我想设置“递归”的深度。例如,如果深度=1,我只需要来自超文本标记语言的href。如果深度=2,我需要来自超文本标记语言的hrefs(假设为list1)和来自list1的每个href的hrefs,依此类推 以下是我使用jsoup得到的结果: 我应该如何修复递归条件以使其正确?