当前位置: 首页 > 知识库问答 >
问题:

html表中的数据小于实际数据

司空劲
2023-03-14

我正在做

Element tbody = doc.select("td#tab table tbody").first();
System.out.println(tbody.childNodeSize());
System.out.println(tbody.html());
document.querySelector('td#tab table tbody').childNodes.length

多谢了。

共有1个答案

晏昀
2023-03-14

文档以大量编码数据开头。我想Jsoup会截断1m之后的大小。如果您想要获得整个文档,您可以这样配置:

String url = "http://164.100.181.140/fcs/Helpline/NFSA/ReportRegidWise.aspx?val=NSMxODcjUiMwMDEzNzMjMDM3OTg0IzEwMDEwMDMwMDAxMiNCUEwjMDkxODcwMDk0NjE4NDI5MQ%3d%3d";
Document doc = Jsoup.connect(url)
                .timeout(10000)
                .maxBodySize(0)  //setting to 0 turns size checking off
                .get();

Element tbodyEl = doc.select("td#tab table tbody").first();
System.out.println(tbodyEl);

这需要更长的时间,但你得到了所有的信息。

 类似资料:
  • 问题内容: 我正在寻找一种在Linux Shell环境中从HTML获取某些信息的方法。 这是我感兴趣的一点: 我想将它们存储在shell变量中或在从html上面提取的键值对中回显这些变量。范例: 目前,我可以做的是创建一个Java程序,该程序将使用sax解析器或html解析器(例如jsoup)来提取此信息。 但是在这里使用Java似乎很麻烦,因为要在您要执行的“包装器”脚本中包含可运行的jar。

  • 问题内容: 已关闭 。这个问题需要更加集中。它当前不接受答案。 想改善这个问题吗? 更新问题,使其仅通过编辑此帖子来关注一个问题。 10个月前关闭。 好的,我在phpmyadmin(sql)上有一个数据库,我想将我的一个表显示为HTML / PHP上的表。我已经在网上搜索过,无法实现此功能,所以我想知道是否有人可以帮助我进行编码? 没有密码 我想显示表名中的数据 问题答案: 您说您在PhpMyAd

  • 问题内容: 我在TensorFlow领域相对较新,对您如何 实际 将CSV数据读取到TensorFlow中可用的示例/标签张量中感到困惑。TensorFlow教程中有关读取CSV数据的示例相当分散,仅使您成为能够训练CSV数据的一部分。 这是我根据CSV教程整理而成的代码: 这是我正在加载的CSV文件中的一个简短示例-基本数据-4个功能列和1个标签列: 上面的所有代码都是 从CSV文件中逐个打印每

  • 以下是使用HTML表的柱形图的示例。 我们已经在Highcharts Configuration Syntax一章中看到了用于绘制图表的配置 。 现在让我们看看其他配置以及我们如何在数据下添加表格。 下面给出了使用HTML表的柱形图的示例。 data 数据模块提供了一个简化的界面,用于从CVS,HTML表格或网格视图等来源向图表添加数据。 data.table HTML表或其id将被解析为输入数据

  • 问题内容: NLTK书中有几个字数示例,但实际上它们不是字数而是令牌数。例如,第1章“计数词汇”说以下内容给出了单词计数: 但是,事实并非如此-它给出了单词和标点计数。如何获得真实的字数(忽略标点符号)? 同样,如何获得一个单词的平均字符数?显而易见的答案是: 但是,这将因为以下原因而关闭: len(string_of_text)是一个字符数,包括空格 len(text)是令牌计数,不包括空格,但

  • 我开始创建一个系统,我(作为目前唯一的用户)将加载一个动态创建的PHP页面,该页面具有