当前位置: 首页 > 知识库问答 >
问题:

使用Jsoup解析网站,该Jsoup在用户滚动时动态加载

方嘉志
2023-03-14

我正在做一个项目,通过使用JSOUP解析一个网站来显示歌曲名称和指向该歌曲的链接。唯一的问题是,我只能得到前10个元素,我想从那个网站,因为当你向下滚动,网站生成更多的元素。我试图解析的特定网站是一个名为Trappedio的音乐网站。你在查看网站时会注意到,当你向下滚动时,会出现更多的歌曲名称和图像。当我在chrome中使用inspect元素时,我看到当我滚动时,它生成了更多我试图解析的元素。

我正在解析的内容的CSS路径:#content>div.container>div>div:nth-child(元素的索引)

问题是当我使用这种方法使用Jsoup得到这个网站时,

Document doc = Jsoup.connect(url).get();

有什么想法吗?关于如何一次加载所有东西有什么建议吗?如有任何回应,我们将不胜感激,谢谢。

共有1个答案

齐典
2023-03-14

这是相当简单的,获得下一组10只需要点击以下

http://trapped.io/?page=2

一般说来,只需在page=page_number查询参数中输入适当的页码,就可以在该页面中得到一组10个元素。

只是一个附带说明,可能有法律问题在刮网站。我希望你已经重新检查了它的法律上可以做刮痧在他们的网站

 类似资料:
  • 正如你在上面看到的,我正试图从https://play . Google . com/store/apps/category/GAME _ ACTION/collection/top selling _ free中抓取一个单词列表 谷歌Play商店页面加载更多的元素,每次你滚动到页面的底部。 我的程序将抓取显示的前40个元素,但由于j汤不会加载动态加载的网页的其余部分,因此我无法抓取前40个元素之

  • 我的问题是关于从特定网站上收集数据的可能性。目前,我的算法正在将HTML转换为文本,然后检查文件中包含的标记词,并求和标记的数量。 我的问题在于在刮网站的同时无法向下“滚动”。正如你所看到的,它正在检查一个twitter帐户上的标志数,但它仅限于50sh最新的tweets。我希望我说清楚了。 附注:我给了twitter一个例子,我不是在为twitter寻找特定的东西,而是更健壮的东西。 我将非常感

  • 问题内容: 在此网站上,您可以输入您的学生卡号,然后显示该卡上还剩多少钱。我想使用JSOUP获得信息。这是我当前的代码,但是不起作用, 我没有太多经验,所以我不知道在哪里寻找问题。一些想法: 我应该使用还是? 在使用chrome devoloper工具时,发布数据是我使用功能发送的所有数据。但是,如果发送时出现错误,为什么? 我应该发送解密或加密的数据吗?(两者均在chrome devoloper

  • 我想解析出这个Nasa页面上的描述,页面底部的文字 我该怎么做?

  • 我试图登录使用领英J汤,我已经尝试了几种方法,但总是遇到错误403,我哪里出错了? 测试一 错误控制台 组织。jsoup。HttpStatusException:获取URL时发生HTTP错误。状态=403,URL=https://www.linkedin.com在org。jsoup。帮手HttpConnection$响应。在org上执行(HttpConnection.java:590)。jsoup

  • 问题内容: 在页面中,我想选择一个变量的值。以下是页面的摘要。 我的目的是使用来从此页面读取变量的值。有可能吗?如果是,那怎么办? 问题答案: 由于jsoup不是javascript库,因此有两种方法可以解决此问题: A.使用JavaScript库 优点: 全面的Javascript支持 缺点: 附加的天秤/依赖项 B.使用Jsoup +手动解析 优点: 无需额外的库 足以完成简单的任务 缺点: