当前位置: 首页 > 知识库问答 >
问题:

用Jsoup提取“隐藏”HTML

谭研
2023-03-14

有多个包含美国专利No.9,000,000的转让数据的div元素出现在行下面

<script async="async" type="text/javascript" src="https://components.uspto.gov/js/ais/2-2-assignment-search.js"></script>

有办法用JSOUP提取这个隐藏的html吗?

共有1个答案

段晨
2023-03-14

数据似乎加载了Ajax。JSoup不处理JavaScript。

您需要的是一个“无头浏览器”API,它处理Javascript而不实际呈现任何内容。

HtmlUnit似乎是最知名的工具,尽管我自己从来没有用过它。正如前面所建议的,Selenium Webdriver也是一个选项。

 类似资料:
  • 我有数据 我正试图选择它与J汤。 但这不起作用。 我在字符串auth_token=处收到空指针异常。 java.lang.crime.ic.Main.main(Main.java: 2) 我做错了什么?

  • 我正在尝试编写一个拒绝非Ajax请求的指令。下面的代码显然不起作用: (此处有2个问题:是&是和是&是。因此它不编译) 我的问题是:我可以有一个局部范围的摘录吗?与中一样,不会转义。 我知道我可以访问请求来拉出头,而不使用,所以请不要这样回答。

  • 我一直在研究用于数据提取的Jsoup示例,并提取了此链接的一个示例 J汤

  • ap.hideToast() 隐藏弱提示。 代码示例 <script src="https://gw.alipayobjects.com/as/g/h5-lib/alipayjsapi/3.1.1/alipayjsapi.inc.min.js"></script> <h2>点击以下按钮查看不同效果</h2> <button class="btn btn-default">显示 toast</b

  • 我有一个带有ID、TEXT等列的表,这里的TEXT是超文本标记语言FORMAT中包含数据的Clob列 样本数据: 当我使用Jsoup.parse(AUDIT_SCOPE_LOB.text()时;我得到的数据如下 我对java知之甚少。我可以使用jsoup获取java代码来提取数据并重新运行下面的outpu吗 实际上,这个数据是一个样本数据。我有一些带有html标记的数据,这里没有提到。

  • 我有一个代码与许多评论,我如何可以隐藏这些,但没有删除,我需要他们之后。