当前位置：首页 > 面试题库 >

如何使用jsoup从此html页面获取文本？

阳光辉

2023-03-14

问题内容：

我正在使用此代码检索本页主要文章中的文本。

public class HtmlparserExampleActivity extends Activity {
String outputtext;
  TagFindingVisitor visitor;
  Parser parser = null;
private static final String TAG = "TVGuide";



TextView outputTextView;

/** Called when the activity is first created. */
@Override
public void onCreate(Bundle savedInstanceState) {
    super.onCreate(savedInstanceState);
    setContentView(R.layout.main);

    outputTextView = (TextView)findViewById(R.id.outputTextView);
    String id = "main-article-content";
    Document doc = null;

    try {
        doc = Jsoup.connect("http://movies.ign.com/articles/100/1002569p1.html").get();
    } catch (IOException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }

    Log.i("DOC", doc.toString().toString());
    Elements elementsHtml = doc.getElementsByTag(id);  
    String[] temp1 = new String[99];    
    int i =0;
    for(Element element: elementsHtml)
    {

        temp1[1] = element.text();
        i++;
        outputTextView.setText(temp1[1]);

问题是textview中没有显示任何内容。我要检索的文字都没有出现。Log.i与调试日志中的段一起显示。因此，我知道其连接成功。只是不知道为什么即时通讯没有在textview中获取任何文本。

问题答案：

以下是您问题的相关摘要：

Document doc = Jsoup.connect("http://movies.ign.com/articles/100/1002569p1.html").get();
Elements elementsHtml = doc.getElementsByTag("main-article-content");  
// ...

您在这里犯了一个根本性的错误。<main-article-content>文档中没有HTML标签。但是，有一个<div id="main- article-content">。根据有关Jsoup食谱一半的CSS选择器概述，您应该使用#id选择器。

Document doc = Jsoup.connect("http://movies.ign.com/articles/100/1002569p1.html").get();
Element mainArticleContent = doc.select("#main-article-content").first();  
// ...

类似资料：

如何使用jsoup从此html标记获取文本？

问题内容：当我使用jsoup提取数据时遇到一个职位。数据如下：我想要这样的数据：我怎样才能做到这一点？谁能帮我？问题答案：您可以将html解析为，选择-Element并获取其文本。例：输出：
从html获取favicon（JSOUP）

如何使用JSOUP从html字符串获取图标路径？我找到了在网页上添加favicon的不同方法- （在谷歌）我能得到的第一个方法是使用doc。选择（“html头元”）但我无法选择链接标签
使用JSoup从所有页面获取结果

我正在使用jsoup库，今天我遇到了一个问题。我必须刮取DuckDuckGo并为每个页面获取查询结果的所有标题，但使用我只得到关于第一页的结果。我怎样才能继续下一页？
如何使用AJAX从其他页面获取div的html？

问题内容：如何获取位于其他站点上的某个html元素的html？解：问题答案：对php或任何其他文件进行ajax调用，使用CURL或其他工具抓取所需的页面，提取div并回显它，然后当您取回html时，将其放在页面的div中
Jsoup 获取HTML

主要内容：Jsoup 获取HTML 语法,Jsoup 获取HTML 说明,Jsoup 获取HTML 示例以下示例将展示在将 HTML 字符串解析为 Document 对象后获取内部 html 和外部 html 的方法的使用。 Jsoup 获取HTML 语法 document ：文档对象代表 HTML DOM。 Jsoup ：解析给定 HTML 字符串的主类。 html ： HTML 字符串。 link ：元素对象表示表示锚标记的 html 节点元素。 link.outerHtml() ： o
Jsoup 读取文件获取HTML

主要内容：Jsoup 读取文件获取HTML 语法,Jsoup 读取文件获取HTML 说明,Jsoup 读取文件获取HTML 示例以下示例将展示使用文件从磁盘获取 HTML，然后查找其数据。 Jsoup 读取文件获取HTML 语法 document ：文档对象代表 HTML DOM。 Jsoup ：连接 url 并获取 HTML 字符串的主类。 url ：要加载的 html 页面的 url。 Jsoup 读取文件获取HTML 说明 connect(url) 方法建立到 url 的连接，get

相关阅读

如何使用jQuery获取整个页面的HTML？如何使用jsoup从HTML解析表如何从Android中的HTML链接获取页面的HTML源？如何仅从HTML页面提取主要文本内容？如何使用Swift从URL获取HTML源

相关文章

Jsoup 解析HTML正文 Jsoup 获取属性 Jsoup 获取URL路径 Jsoup 清理HTML Jsoup 设置HTML

相关问答

如何使用 jsoup 获取 href 使用Jsoup获取完整的HTML 使用Jsoup提取HTML 如何使用Jsoup从html数据中获取图像源和描述如何使用selenium java从下面的html代码中获取文本？

相关工具

获取网页的所有图片 jsoup 多线程页面抓取服务器解析html网页的数据 JW Page factory 页面工厂

相关文档

Jsoup 中文文档 JSoup 中文教程上云如此简单 Jsoup 学习笔记 StackExchange.Redis 中文使用文档