尽管这听起来可能太基本了,但我想问一下如何使用JSoup从doc中删除元素。
我试图寻找它,但没有成功。
问题是:
Elements myNewElements = doc.getElementsByAttribute("hello");
//Now I need to perform some other methods on myNewElements before removing.
//Hence..suggested method says,
doc.getElementsByAttribute("hello").remove();
这工作罚款。但是我相信一次又一次地选择相同的元素可能会证明内存饥饿。有可能吗?
doc.select(myNewElements).remove();
//尝试从doc中选择myNewElements。
更好地在元素上循环并在以下范围内删除它们:
for( Element element : doc.select(myNewElements) )
{
element.remove();
}
还有一个类似的问题:使用jsoup解析html并删除标记块
元素中的每个元素都有一个对其父元素的引用,而Remve()方法只是告诉父元素删除该子元素。
本质上,只是做:
myNewElements.remove()
应该管用。
我正在使用以下代码用JSoup解析超文本标记语言: 我的html示例将包括如下文本: 然而,JSoup的输出总是: 我想要的输出是这样的: (请注意,该行在“some text”和“later”之后返回) 如果我想保留间距,有没有其他方法代替wholeText?我确实发现了以下类似的stackoverflow问题: 在使用jsoup将html转换为纯文本时,如何保留换行符? 然而,这个问题的问题是
我已经使用了一段时间,但我遇到了一个错误,其中JSoup自动删除"表"元素,找不到任何解决方案... 如果你导航到这段代码中的链接,你可以看到有多个元素“表”(例如:在“Saison 01(VF)”下,有22个包含“Episode x”的表元素),但是它们在JSOUP输出中不存在... 我试图用一个简单的获取文档,打印它(表元素在那里),用Jsoup解析它,重新打印(表元素不见了),所以我知道这不
我想删除html和tables标签和里面的任何东西(childs),最好的方法是什么? 我试着像这样遍历文档,但它不起作用,在Jsoup文档中,它说从DOM及其子对象中删除元素:
什么是正确的方法来删除只有HTML标签(保留所有自定义/未知的标签)与JSOUP(不是正则表达式)? 预期输入: 预期产出: 我尝试使用白名单清洁剂。none(),但它也会删除自定义标记。 我也尝试过: 但是它也删除了自定义标签。 这个答案对我不好,因为自定义标记的数量是无限的。
我正在做一个项目,我只对页面布局感兴趣,对文本不感兴趣。我现在很难摆脱文本级别的每一个元素。例如: 我想在文本级别上去掉ul,li,p和h3元素,但保留div和带有菜单项的列表,因为这是页面布局的一部分。如何使用JSOUP实现这一点? 我一直试图通过document.select()和.remove()这些元素来实现这一点,但是select函数并不是为这种非标准查询而设置的。 编辑:我想得到的最终
问题内容: 我想从JSON中删除JSON元素或整行。 我有以下JSON字符串: 问题答案: 您可以使用splice从数组中删除元素。