问题：

利用JSOUP从网页中检索有用信息

东弘扬

2023-03-14

是否有任何其他健壮的方法，或者如果我可以使用页脚链接和我已经完成的方法来结束，如果一个页面肯定是一个联系我们的页面？

共有1个答案

商夜洛

2023-03-14

但我不能百分之百确定所提取的链接...

你永远不会确定。

对于给定的随机HTML页面，您希望找到“联系我们”链接。这种工作对一个人来说是微不足道的。这对计算机来说是一个巨大的挑战。

null

+ work done by human
+ dynamically adapt to unknown pattern
- cost money
- We suck at repetitive tasks

null

例如，看看Weka或Java-ML。

+ Automated task
+ Can perform a repetitive task long time
- May take time to built a robust solution
- Risk of false positive or complete miss

选项3：使用Jsoup

仔细研究目标网站的模式
告诉Jsoup查找您检测到的模式

+ Automated task
+ Can perform a repetitive task long time
- Take time for studying, discovering, adding new patterns
- Risk of false positive or complete miss

+ Reduce chances of false positive or complete misses
+ More confident final result
- Take time for studying, discovering, adding new patterns
- Cost money

类似资料：

从页面检索所有信息

我试图在一个旧的海军网页上抓取产品的URL。然而，它只是给出了产品列表的一部分，而不是全部（例如，当超过8个URL时，只给出8个URL）。我希望有人能帮我找出问题所在。
使用JSoup从Google搜索结果的所有页面检索所有链接

问题内容：我有以下代码，用于使用JSoup在Java中解析HTML。问题是我只能检索首页搜索结果链接。我应该怎么做才能从Google搜索结果的其余页面获得链接。问题答案：如果要从第二页获得结果，请添加到URL。对于第三页使用，依此类推。
使用python和BeautifulSoup从网页检索链接

问题内容：如何检索网页链接并使用Python复制链接的URL地址？问题答案：这是在中使用类的一小段代码：
使用从HTTPClient检索到JSoup的数据

我正在使用HTTPClient连接到一个网站。以下代码片段用于此目的：上面的代码显示了网站的html代码。此外，我只想访问代码中的一些数据，我可以使用以下代码片段使用JSoup访问这些数据：在上面的代码中，我使用“url”直接指定了网站的url。这意味着如果我使用JSoup，我不需要HTTPClient。有没有一种方法可以将使用HTTPClient检索到的“responseBody”集成到JS
我必须使用jsoup从html表中检索数据

这里是表格输入图像描述我正在使用这个代码我收到了以下输出：但我只想要科目名称和出勤情况我试过很多事情，但没有任何结果。实际上我想存储的科目名称，参加的讲座和总讲座和百分比所以我可以在应用程序中很好地显示这一点示例：而且更新的帖子：- 添加此代码后我得到了这个输出：- 我每门功课考四遍新更新的帖子：
NodeJs-从JWT令牌中检索用户信息？

问题内容：节点和角度。我有一个MEAN堆栈身份验证应用程序，在其中按如下所述在成功登录时设置JWT令牌，并将其存储在控制器的会话中。通过服务拦截器将JWT令牌分配给config.headers： authservice.js Interceptor（省略了requestError，response和responseError）：现在我想从令牌中获取登录的用户详细信息，我该怎么做？我尝试如下，但

利用JSOUP从网页中检索有用信息

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档