我是新来的JSoup
和学习它我想从Imdb站点/特定的电影链接提取评级,并发现我将能够从div与class=star-box-细节
,因此我写了以下内容代码:
public static void main(String [] args)
{
try {
Elements data;
String userAgent = "ExampleBot 1.0 (+http://example.com/bot)";
String url = "http://www.imdb.com/title/tt0114746/";
data = Jsoup.connect(url).userAgent(userAgent).get().select("div.star-box-details").select("[href]");
System.out.println(data);
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
很奇怪,我没有得到任何数据,因为我能够在几周前得到评级数据。是div与class=star-box-细节
存在于页面/url上。
该特定的用户代理可能被阻止内容返回的站点过滤。你可以用
String userAgent = "Mozilla/5.0 (Windows; U; WindowsNT 5.1; en-US; rv1.8.1.6) Gecko/20070725 Firefox/2.0.0.6";
尝试使用Jsoup而不是网站API从网站上练习和获取信息。我的代码没有错误,但文本字段没有更改。它只是给我一个空白。我如何从网站上获取信息?我正试图获取主要新闻,以便在我的网站上发布。 我的代码:
我正在使用java从BNN网站上简单地跟踪股票的变化,我已经将其全部设置为访问正确的值。然而,我得到的不是一个数值,而是。如何访问网站上显示的数值? 此外,如果你能帮我得到这个网站上的当前值,那也会很有帮助。 //编辑// 我更新了我的代码,但现在输出只有2,它只是从{{quoteObj.high|Number: 2}}中获取数字,我希望在网站上显示实际的数字值。 我已经附上了一个网页的图像和ht
我正在为Java开发人员使用最新的Eclipse IDE中的最新jsoup(1.13.1)(包括孵化组件)版本:2020-09(4.17.0)构建ID:20200910-1200。 我试图解析一个非常具体的网站,但没有成功。在我执行这些行之后:doc=jsoup.connect(“http://pokehb.pw/%d7%a2%d7%95%d7%a0%d7%94/21/%d7%a4%d7%a8%d
我正在尝试用JSOUP从以下页面获取内容:
所以我尝试从pretag获取数据,我设置doc连接到url选择pretag,结果出错了,我需要获取的数据按这里
我有一些url。我想从url指向的html中获取所有href,从所有获取的hrefs中获取所有href(递归)。关键是我想设置“递归”的深度。例如,如果深度=1,我只需要来自超文本标记语言的href。如果深度=2,我需要来自超文本标记语言的hrefs(假设为list1)和来自list1的每个href的hrefs,依此类推 以下是我使用jsoup得到的结果: 我应该如何修复递归条件以使其正确?