当前位置：首页 > 专题 >

《jsoup》专题

使用Jsoup Java登录
问题内容：如何通过jsoup登录？我试过了，但是不起作用：问题答案：通常，登录网站需要两个步骤- 您发送请求以获取页面，然后从中提取一些值，例如会话ID等以及cookie。您发送带有第1步中的值以及您的用户名和密码的请求。要知道您需要发送哪些值，请在开发人员模式下使用浏览器（按F12键）并检查流量。更改字符串以匹配您的浏览器，因为某些站点将不同的页面发送到不同的客户端。
Jsoup：从锚标记中提取内部文本
问题内容：这是我的问题。我有一个html内容：innerText我需要提取“ innerText”。在Jsoup中尝试此操作时，我发现当由Jsoup解析时，内部文本超出了定位标记。这是我的代码输出：为什么“ innerText”移到了定位标记之外？问题答案：您可以通过调用元素上的方法来访问文本。顺便说一句使用您发布的代码（和JSoup 1.8.1）产生以下输出
使用JSoup抓取Google结果
问题内容：我正在尝试使用JSoup从Google抓取搜索结果。目前这是我的代码。我只是想获取搜索结果的标题以及标题下方的摘录。是的，我只是不知道要搜寻这些元素要查找哪些元素。如果有人有更好的方法使用Java抓取Google，我想知道。谢谢。问题答案：干得好。另外，要自己完成此操作，我建议您使用chrome。您只需右键单击要刮取的任何内容，然后检查元素。它将带您到该元素位于html的确切
如何使Jsoup白名单接受某些属性内容
问题内容：我正在将Jsoup与轻松的白名单一起使用。看起来很完美，但我想保留嵌入的图像标签，例如。有没有办法修改白名单以接受这些img？编辑：如果使用，则不会删除那些img标签。但是它接受“ data：”之后的任何内容，如果src内容以“ data：; base64”开头，我只想保留它们。jsoup是否可能？问题答案：您可以扩展白名单并覆盖isSafeAttribute以执行自定义检
页面内容是用JavaScript加载的，而Jsoup看不到它
下面是我需要的内容的元素: 我需要用Java获取这些信息。最好使用JSOUP。元素是JavaScript帮助下的字段： Java代码：
Java JSoup提取URL时出错
线程“main”org.jsoup.HttpStatusException中出现异常：提取URL时出现HTTP错误。status=403,url=java Html解析器提取特定数据？在org.jsoup.helper.httpconnection$response.execute(httpconnection.java:590)在org.jsoup.helper.httpconnection$r
如何让jsoup等待完整的页面（跳过一个进度页面）加载？[副本]
我正在尝试使用JSOUP解析一个网页并提取数据。但该链接是动态的,在显示详细信息之前会弹出一个等待加载页面。因此Jsoup似乎处理等待页面而不是详细信息页面。有没有让它等到页面完全加载？
如何抓取多个url使用jSoup[关闭]
我有下面的代码，可以使用JSoup抓取网站，但我想同时抓取多个URL。我将URL存储在一个数组中，但无法使其工作。如果我想使用它，如何在多线程中实现这段代码？多线程对这样的应用程序有好处吗？
403错误，而获得谷歌结果使用jSoup[重复]
我正在尝试使用以下代码获取Google结果：但是我得到了这个例外： 403错误意味着服务器禁止访问，但我可以很好地在Web浏览器中加载此URL。为什么J汤会出现403错误？
jsoup 403错误。简单的网页很好用
我看过其他类似的帖子，但没有明显的跳出。如果我错过了，我相信有人会给我指出正确的方向！问题是我的应用程序中的此代码曾经有效，但不再有效。所以我假设网站发生了变化。我在同一个应用程序中为其他三个网站使用完全相同的代码，它们运行良好。LOGCAT显示以下错误： org.jsoup.HttpStatusException：获取URL时出现HTTP错误。status=403， URL=http://no
Java：使用JSoup提取其中包含某个单词的所有链接？
可能是一个不清楚的问题，下面是代码和说明：字符串exampleThmlData包含来自特定站点的已解析HTML源。这个网站有很多链接可以将用户直接链接到谷歌。例如：我想提取所有包含谷歌的链接。com/example/位于与文档的链接中。选择函数。如何使用JSoup实现这一点？
超文本标记语言表转换成Excel使用JSOUP
我将html表格从网页复制到excel，并尝试使用下面的代码，但没有结果。请就如何解决这个问题提出建议。我做了所有的实验，但没有得到正确的结果。
使用java jsoup not give Elements解析instagram提供源代码
使用Jsoup从特定类获取所有href值
我试图解析我的大学网站，以获得一个新闻列表（标题+链接）从主要网站。然而，当我试图解析一个完整的网站时，我要查找的链接被嵌套在其他类、表等的深处。下面是我试图使用的代码：但不管用。如果每一个链接都放在以下位置，那么是否有更好的方法获得所有这些链接的href值和标题：也许是某种循环，它会迭代所有这些标记，并从中获取值？感谢帮助：-）
Jsoup,忽略带有javascript弹出窗口的链接
我使用jsoup解析一些页面的链接，然后使用httpclient测试链接，看看它们是否工作。我网页上的一些链接是，我想忽略这些。

首页

7

8

9

10

11

12

13

14

15

尾页

最新发布

腾讯IEG测开一面数字马力（长沙）测开一面（考研失利）小鹏汽车测试滴滴测开日常一面+二面酷家乐测开三面凉经

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

前端 - 有什么安卓自动化工具可以实现微信小程序的自动化签到？前端 - SwiftUI ScrollView 内含 Button 无法检测滚动怎么办？是swiftui的bug吗？javascript - 如何解决浏览器清除缓存导致axios请求404？前端 - 请问React（或者zustand）中是否可以对已经存在的状态做监听生成一个新的状态？javascript - antd表头搜索切换表数据后无法清除搜索内容，该怎么解决？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

照片浏览 process-monitor weboob ApiChassis Launchpad netgraph OptiKey iforums

文档资料

Apache Ant 入门教程 Nunjuck 中文文档小米智能硬件开放平台智能硬件接入文档 CanalSharp 中文文档算法系列15天速成