当前位置：首页 > 专题 >

《jsoup》专题

使用jsoup将html转换为纯文本时，如何保留换行符？
问题内容：我有以下代码：结果是：但我想打破界限：我已经看过jsoup的TextNode＃getWholeText（），但是我不知道如何使用它。如果我解析的标记中有一个，如何在结果输出中换行？问题答案：保留换行符的真正解决方案应该是这样的：满足以下要求：如果原始html包含换行符（\ n），则保留它如果原始html包含br或p标签，它们将被翻译为换行符（\ n）。
使用Jsoup提交登录表单时出现问题
问题内容：由于某些原因，当我使用正确的登录信息时，此代码将不允许我进入网站。该帖子登录页面的代码，说明我的代码没有工作。有人可以告诉我我忘记了什么或出了什么问题吗？问题答案：除了，并且，该网站requeires为登录两个额外的价值- 和。您可以从第一个请求的响应中获取它们，如下所示- 并将其添加到（顺序并不重要）之后- 我还将字段添加到两个请求中- 一些站点对其进行测试并将不同的页面发送到
用jsoup解析JavaScript
问题内容：在页面中，我想选择一个变量的值。以下是页面的摘要。我的目的是使用来从此页面读取变量的值。有可能吗？如果是，那怎么办？问题答案：由于jsoup不是javascript库，因此有两种方法可以解决此问题： A.使用JavaScript库优点：全面的Javascript支持缺点：附加的天秤/依赖项 B.使用Jsoup +手动解析优点：无需额外的库足以完成简单的任务缺点：
使用jsoup解析html的table中的文本信息实例
本文向大家介绍使用jsoup解析html的table中的文本信息实例，包括了使用jsoup解析html的table中的文本信息实例的使用技巧和注意事项，需要的朋友参考一下 jsoup是一个非常好用的html解析工具。使用时需要下载相应的jar包。下面就是我使用jsoup解析html的表格的java源代码。亲测可用！以上这篇使用jsoup解析html的table中的文本信息实例就是小编分享给
SpringBoot中使用Jsoup爬取网站数据的方法
本文向大家介绍SpringBoot中使用Jsoup爬取网站数据的方法，包括了SpringBoot中使用Jsoup爬取网站数据的方法的使用技巧和注意事项，需要的朋友参考一下爬取数据导入jar包新建实体类编写爬虫工具类可以看到内容、图片、价格系数爬取到此这篇关于SpringBoot中使用Jsoup爬取网站数据的方法的文章就介绍到这了,更多相关SpringBoot Jsoup爬取内容请搜索呐
如何使用Jsoup提取单独的文本节点？
问题内容：我有一个像这样的元素：如何分别提取TextA和TextB？问题答案：几种方法。这实际上取决于文档本身以及给定的HTML标记是否一致。在此特定示例中，您可以获取的子节点，然后分别测试每个节点是否为。例如导致我认为，如果Jsoup提供了或东西来获取子文本节点，就像获取子元素一样（在您的示例中将返回该元素），那会很好。
是否可以使用Jsoup 1.8.1将HTML转换为XHTML？
问题内容：期望：结果： Jsoup可以将值HTML转换为XHTML吗？问题答案：见：
Android-使用JSOUP解析JS生成的网址
问题内容：我试图解析由Bootstrap的Bootpage.js生成的URL，该URL看起来像但JSOUP无法解析它并显示主URL。如何从Bootpage获取正常链接或如何使JSOUP对其进行解析。解析代码：问题答案：（请参阅下面的UPDATE ，第一个/可接受的解决方案不符合android的要求，但仅供参考。）桌面解决方案 HtmlUnit似乎无法处理此站点（最近经常发生这种情况）。
使用Jsoup时，Java 11 HTTPS连接因SSL握手异常而失败
我试图抓取一个网页（这一个）使用J汤库。在执行简单的GET操作时，我得到了以下异常：这是JsoupParser的内容。解析方法：起初，我认为这是由于缺少密码套件造成的，但后来我发现这个异常是由于JDK 1.8u141之前版本中的一个错误造成的。我尝试使用JDK1.8u191，一切正常，但是当我使用JDK11时，上面的异常再次出现。我还缺什么吗？谢谢你的帮助。当我使用早期访问jdk 12时，这
如何制作Jsoup白名单以接受某些属性内容
我正在使用带有轻松白名单的J汤。它看起来很完美，但我想保持嵌入的图像标签，如
使用Jsoup（Java）比较两个HTML文档
我想比较两个使用Jsoup表示为字符串的HTML文档，忽略空格中的任何差异。简化示例：这两个文档之间的唯一区别是在body标记之后的第二个文档中增加了新行。体标记中产生的子节点不同。第一个文档有一个元素节点和一个文本节点（包含新行）。第二个文档包含相同的两个节点，但是有一个额外的文本节点包含另一个新行。这个额外的文本节点可能是文档规范化的结果（将正文标记之外的文本节点移动到正文，请参见文档#
如何使用JSOUP从html的p标记中提取span中的颜色？
“我妈妈有一双蓝眼睛，我爸爸有一双深绿色的眼睛”。我想用JSOUP解析这个句子，并在android textview上用粗体和彩色文本打印出来。这里的“蓝色”是大胆的蓝色。“深绿色”是大胆的颜色。我需要解析上述html代码，并需要如下显示：这是一个标题我母亲有蓝色的眼睛，我父亲有深绿色的眼睛这是另一个标题这是一段下面是我的程序。考虑到文档doc==获取上面的html；有人能帮我解决吗
从html获取favicon（JSOUP）
如何使用JSOUP从html字符串获取图标路径？我找到了在网页上添加favicon的不同方法- （在谷歌）我能得到的第一个方法是使用doc。选择（“html头元”）但我无法选择链接标签
使用JSoup仅删除HTML标记，而不删除“”标记中的数据
我使用JSoup解析字符串，其中包含超文本标记语言标记为纯文本。例如：它可以很好地解析它，但问题是我的Java字符串是否包含
如何使用jSoup访问子类
我想访问此网页：https://www.google.com/trends/explore#q=ice在中心线图中筛选并提取数据。html文件是（在这里，我只粘贴我使用的部分）：并且我使用的数据存储在脚本部分（最后一行）。我的想法是先获取类“报告-内容”，然后选择脚本。我的代码如下：打印“中心”类时，可以得到除“报表内容”之外的所有子类内容，打印“报表内容”时，结果只有：我也尝试这样做：但

首页

1

2

3

4

5

6

7

8

尾页

最新发布

腾讯IEG测开一面数字马力（长沙）测开一面（考研失利）小鹏汽车测试滴滴测开日常一面+二面酷家乐测开三面凉经

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

前端 - 有什么安卓自动化工具可以实现微信小程序的自动化签到？前端 - SwiftUI ScrollView 内含 Button 无法检测滚动怎么办？是swiftui的bug吗？javascript - 如何解决浏览器清除缓存导致axios请求404？前端 - 请问React（或者zustand）中是否可以对已经存在的状态做监听生成一个新的状态？javascript - antd表头搜索切换表数据后无法清除搜索内容，该怎么解决？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

照片浏览 process-monitor weboob ApiChassis Launchpad netgraph OptiKey iforums

文档资料

JasperReports 入门教程 Chromium 中文文档 Windows 程序设计 GatewayWorker 2.x 3.x 手册 CSS 创作指南