当前位置: 首页 > 面试题库 >

如何使用jsoup从此html标记获取文本?

井礼骞
2023-03-14
问题内容

当我使用jsoup提取数据时遇到一个职位。数据如下:

This is a <strong>strong</strong> number <date>2013</date>

我想要这样的数据: This is a number

我怎样才能做到这一点?谁能帮我?


问题答案:

您可以将html解析为Document,选择body-Element并获取其文本。

例:

Document doc = Jsoup.parse("This is a <strong>strong</strong> number <date>2013</date>");

String ownText = doc.body().ownText();
String text = doc.body().text();

System.out.println(ownText);
System.out.println(text);

输出:

This is a number  
This is a strong number 2013


 类似资料: