当前位置: 首页 > 知识库问答 >
问题:

找不到带有 jsoup 的 div 元素

夏侯智鑫
2023-03-14

我想从这个网站上提取红色标记的信息。

本站的html文本由以下图片呈现。我要提取的信息再次被红色标记。

问题是我找不到带有class属性“find-元素”的div元素。我的代码看起来像这样

public static void main(String[] args) {
    try {
        Document doc = Jsoup.connect("https://bestmentor.edudip.com/webinar/Lebe-deine-Berufung-und-deine-Arbeit-ist-Liebe/89620").get();           
        Elements ereignisse = doc.select("div#rating-entries div.found-elements article.rating div.text p");
        //Elements ereignisse = doc.select("body div#com-edudip-main-container div#content div.bottom div.academy-sidebar div.box div.ratings-exist div#rating-entries div.found-elements");        

        System.out.println(ereignisse.size());
        // Selektierte Elemente ausgeben ohne HTML-Tags
        for (Element e : ereignisse) {

            System.out.println(e.cssSelector());
            System.out.println(e.text());
        }
    } catch (IOException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }

}

如果有人能帮我,那就太好了。

谢谢。

共有1个答案

米裕
2023-03-14

看起来您的目标是在页面加载后通过 ajax 加载的内容。Jsoup不执行脚本,但作为替代方案,您可以切换到使用无外设Web浏览器,如幻影

 类似资料:
  • 我正在制作一个python脚本,给出Scratch.mit.edu网站上的前5个特色项目。我正在使用请求获取数据。具有这些项目标题的元素位于div标记中,但当我使用bs4时,它不显示div标记的子项或后代。我怎么看标签里面? 我已经尝试了find_all()、find()、.descendents和.children。 我需要 的输出 匿名用户 API 使用页面用来更新内容和解析json响应的ap

  • 有人能告诉我为什么下面的代码不返回表情符号属性吗... 但是下面的代码将返回一个表情符号属性... 我知道我已经将滚动添加到第二个代码中,所以它会查看整个页面并返回我要查找的元素。但除此之外,它们或多或少是相同的。我可以每隔几秒钟运行第一个代码,它永远找不到表情符号元素。它会发现代码和optCriteria没有问题,并将它们作为tradeCriteria打印在一起,但即使它在那里,它也永远找不到表

  • 我试图使用Selenium和Python自动化一些测试。我使用Selenium IDE创建了一个套件,它工作得很好。 我现在试图在Python脚本中重新创建这个套件,但遇到了一个问题。 使用XPATH代替ID 使用隐式等待 使用从IDE导出到Python生成的函数 使用WebDriverWait 以下是IDE中的html定义: 使用隐式等待的Python脚本。所有工作都很好,直到最后一行中的冒犯元

  • 我是Jsoup解析的新手,我想获得这个页面上所有公司的列表:https://angel.co/companies?company_types[]=startup现在,一种实现这一点的方法实际上是使用与我需要的相关的div标记来检查页面。但是,当我调用该方法时: 首先,我甚至无法在我的consol html输出中找到那些DIV标记(这些标记应该给出公司的列表);其次,即使我找到了它,我如何才能找到具

  • 这是我试图解析的html: 我想得到

  • 问题内容: 我有一个工作脚本,可以使用selenium登录到站点,如下所示: script.py 通过以下方式在安装了Firefox的 亚马逊Ubuntu盒子 上运行该脚本: 我得到的错误是: selenium.common.exceptions.NoSuchElementException:消息:u’无法找到元素:{“ method”:“ id”,“ selector”:“ content”}’