所以,假设我在这里有这个HTML块:(这是Java JSOUP(顺便说一下)) 现在我有一个元素列表(作为elements类型),我想选择这些元素,但只选择那些在img标记的alt=“”部分中具有“vegetarian”属性的元素。 现在我可以根据是否是素食主义者来选择,例如 meals.select(“img[alt=fegetarian]”) 但这只将实际的img标记作为元素返回,从而丢失了对
我正在做一个项目,通过使用JSOUP解析一个网站来显示歌曲名称和指向该歌曲的链接。唯一的问题是,我只能得到前10个元素,我想从那个网站,因为当你向下滚动,网站生成更多的元素。我试图解析的特定网站是一个名为Trappedio的音乐网站。你在查看网站时会注意到,当你向下滚动时,会出现更多的歌曲名称和图像。当我在chrome中使用inspect元素时,我看到当我滚动时,它生成了更多我试图解析的元素。 我
我想从这个HTML中解析数据(CompanyName,Location,jobDescription,...)使用JSoup(java)。我在尝试迭代工作列表时会被卡住 从HTML中提取是我想要迭代并从中提取数据的许多“joblisting”div中的一个。我只是无法处理如何迭代特定的div对象。很抱歉这个问题,但也许有人可以帮助我谁已经知道使用哪一个功能。选择? 文件输入=新文件(“C:/tal
我试图在我的Android Studio项目中使用jsoup,但我一直收到这个错误:错误:(10,16)Gradle:错误:包org.jsoup不存在。 你们能告诉我如何将jsoup库添加到我的项目中的步骤吗?提前致谢。 编辑:出于学习目的,我单独运行java代码,没有主活动! 代码:
我有下面的代码行来获取一个html文档使用jSoup 无论我使用什么标题,这都会超时。相同的网址: 当我在Chrome或火狐上打卡时,工作完全正常。我错过了什么?提前感谢所有的帮助。
我使用jsoup连接到url并加载文档,然后使用正则表达式检查文档是否包含它。但它在某些情况下失败了。下面的代码从一些URL获取所有电话号码,但在其他URL中失败,例如http://www.wellclean.com/我在打印文件时检查了文件中包含的电话号码。 当我打印文档时,它包含以下格式的电话号码
我的代码不会获取这样的链接。使用doc.select也没有帮助。我的问题是,如何从页面中获得所有链接? 编辑:我想我知道问题出在哪里了。我遇到麻烦的页面写得很糟糕,HTML验证器抛出了大量的错误。这会引起问题吗?
我在wiki上搜索目录时遇到了麻烦。我正在为一个个人项目做一个简单的网页刮刀,我不知道如何刮这些数据。 下面是我试图从任何给定的wiki页面中刮取目录的尝试 下面是我要刮的页面中的代码,我如何只得到单词“chronology”?:
我试图在标签之间获得文本并保存到一些变量中,例如:在这里我想保存值,这是标签之间。我还需要其余的文本,这是在标签,标签值分配与和标签值应该只返回- 我写了下面的内容:下面返回的只是“'em”标记中的“return”。这里的基本上是,选择标记,然后进行迭代,不确定我的方法是否正确,任何其他方法都受到高度赞赏。
我以前问过另一个问题,可以在Jsoup解析HTML问题上看到。我试图解析一个数据值从一个网站到我的android应用程序。我现在意识到,虽然在我的应用程序中,我给出了网页的url和我需要的数据,但当我从我的应用程序连接到url时,它总是连接到网站的登录页面,因此找不到要解析的数据。我在想有没有办法避免这种情况?
这里是表格输入图像描述 我正在使用这个代码 我收到了以下输出: 但我只想要科目名称和出勤情况 我试过很多事情,但没有任何结果。实际上我想存储的科目名称,参加的讲座和总讲座和百分比 所以我可以在应用程序中很好地显示这一点 示例: 而且 更新的帖子:- 添加此代码后 我得到了这个输出:- 我每门功课考四遍 新更新的帖子:
正如您在下面看到的集群名称,我有两个主机名和,其中状态为,但状态为。 因此,我将打印作为集群名,并打印作为主机名,因为它已关闭。使用JSOUP可以做到这一点吗? 到目前为止,我能够使用jsoup提取整个HTML表,但不确定如何提取集群名和主机名- 更新:- 表中可能有两个集群名称,如下所示- 现在,如果您看到上面,我有两个集群名称--一个是,另一个是,所以我想找到所有仅为集群名称关闭的计算机。
第1行 第2行 无序列表 元素1 元素2
我需要提取以下html https://ndb.nal.usda.gov/ndb/search/list中列出的所有食品的ID和mfg.name 我正在使用Jsoup并且对它很陌生。
我是使用Jsoup的新手,我遇到了一个问题,无法从类名text为字符串的div中获取文本值。这是一个想要丢弃的字符串。 谁能帮帮我。非常感谢。