当前位置: 首页 > 知识库问答 >
问题:

无法获得使用jsoup解析HTML页面的某种链接

子车青青
2023-03-14

http://www.argenteam.net/movie/40749/American.Reunion.%282012%29

我正在尝试使用JSOUP获得该页面上的所有类似于这样的链接:

<a href="ed2k://|file|American.Reunion.UNRATED.DVDRip.XviD.CD1-COCAIN.avi|734205866|C92C5188830C4F740C69521F67337A45|h=Z5F72XEXRGGXBCMSOR6NS3IBCTFIHQLL|/">CD1</a>

问题是我无法获得这种链接。做了一些极端的事情,我尝试了下面的代码来获得页面上的所有链接,但是这个“a[href]”再次出现在列表中。

doc = Jsoup.connect("http://www.******.net/movie/40749/American.Reunion.%282012%29").get();

Elements ed2k = doc.select("a[href]");
    for (Element emule:ed2k){
            String mula = emule.attr("href");
           }

最终编辑与解决方案:

该网站请求一个cookie来显示我需要的链接,因为这个cookie只是使用真正的浏览器生成的,所以Jsoup无法检索所有的信息,它连接到的是真正页面的缩小版。在Jsoup连接中发送特定的cookie解决了这个问题。示例:

doc = Jsoup.connect(your url here).cookie(cookie name, cookie value).get();

共有1个答案

田博超
2023-03-14

我在您指定的url的源代码中没有看到任何这样的链接。

通常,您可以使用以下属性值选择语法来完成所要求的操作:

[attr^=valPrefix] 
elements with an attribute named "attr", and value starting with "valPrefix"    
Example: a[href^=http:]

(摘自http://jsoup.org/apidocs/org/jsoup/select/selector.html)

 类似资料:
  • Jsoup库未解析给定URL的完整html。URL的原始html中缺少一些分区。 有趣的事情:http://facebook.com/search.php?init=s:email&q=somebody@gmail.com&type=users 如果您在jsoup的官方站点http://try.jsoup.org/中给出了上面提到的url,它通过提取正确地显示了url的确切html,但是在使用js

  • 我想解析出这个Nasa页面上的描述,页面底部的文字 我该怎么做?

  • 本文向大家介绍Android开发之利用jsoup解析HTML页面的方法,包括了Android开发之利用jsoup解析HTML页面的方法的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了Android利用jsoup解析HTML页面的方法。分享给大家供大家参考,具体如下: 这节主要是讲解jsoup解析HTML页面。由于在android开发过程中,不可避免的涉及到web页面的抓取,解析,展示等等,

  • 主要内容:Jsoup 使用DOM解析HTML 语法,Jsoup 使用DOM解析HTML 说明,Jsoup 使用DOM解析HTML 示例以下示例将展示在将 HTML 字符串解析为 Document 对象后如何使用类似 DOM 的方法。 Jsoup 使用DOM解析HTML 语法 document : 文档对象代表 HTML DOM。 Jsoup : 解析给定 HTML 字符串的主类。 html : HTML 字符串。 sampleDiv : 元素对象表示由 id“sampleDiv”标识的 html

  • 我试图在谷歌中键入,并在记事本文件中获取结果的所有标题文本。我想得到所有页面上的所有可用链接,直到搜索的最后一页。但只有第一页的链接,我得到。当我调试并运行时,它可以工作大约10页。帮我做这件事。 JAVA代码:

  • 问题内容: 这是我的HTML来源 这是我获取内容的Java程序,它过滤HTML标记 是否有使用Jsoup而不是使用Java而不是Regex解析HTML内容的简便方法 有没有办法只获取所需的内容。所以在这里我只需要内容“项目2-222” 问题答案: 尝试使用jsoup轻松解析: 要了解更多信息,请访问Jsoup Docs