当前位置: 首页 > 知识库问答 >
问题:

如何在解析文档时用另一个字符串替换文档中字符串的一部分

常哲彦
2023-03-14

我有一个解析的PDF文档,我使用java中的库进行了解析。问题是文档中的表没有正确解析,它像文本一样被解析(一行一行)。所以我使用了一个名为Camelot的Python库,它给了我解析的表格式,我将其发送到java。我需要用Camelot中的表替换PDF解析的表,并保持其余的不变。文档中有多个表,因此解析的表以字符串列表的形式返回,每个索引给出每个表的解析值。

标记表示Camelot输出的附加图像中每个表的末尾。

我通过调用allmatch()方法尝试使用streams,但无法替换该节,因为allmatch()给出了boolean()值(仅指示字符串是否匹配,而不给出元素本身)。camelot的输出如下

Java解析的pdf

共有1个答案

钱弘壮
2023-03-14

这可以通过使用自定义收集器的流API来完成。检查此链接:根据流api的条件将列表拆分为子列表

 类似资料:
  • 问题内容: 我有一些带有数字和英文单词的字符串,我需要通过找到它们并将其替换为该单词的本地化版本,将它们翻译成我的母语。您知道如何轻松实现替换字符串中的单词吗? 谢谢 编辑: 我已经尝试过(字符串“ to”的一部分应替换为“ xyz”): 但这不起作用… 问题答案: 它正在工作,但是不会修改调用者对象,而是返回一个新的String。 因此,您只需要将其分配给新的String变量或自身即可: 要么

  • 问题内容: 我有以下数据框 我想更换和使用,所以最终的数据帧 我尝试了以下操作,但没有成功: 问题答案: 解决方案与通过: 如果需要将列中的所有值设置为一些:

  • 我有以下数据框 我想用替换和,因此最终的数据帧是 我尝试了以下方法,但不起作用:

  • 问题内容: 假设我有以下代码: 这段代码运行后,价值会 如果我以相反的顺序替换它们,则会发生类似的问题: 的值将是 我的目标是把成我怎么能做到呢? 问题答案: 使用Apache Commons StringUtils中的方法:

  • 我有以下字符串: 我想做的是用另一个字符串替换所有 字符 结果是: 基本上,保持的顺序替换为中的交错字符。 < code>rep的总长度与< code >的总长度相同?,20个字符。 请注意,我不想作为额外的步骤再次手动拆分< code>rep。 我尝试了这个,但失败了:

  • 问题内容: 我想做这个: 我基本上想返回字符串:{(str)-> str} 我一直在获取未定义的变量。 抱歉,这是我的第一篇文章。 问题答案: 由于Python中的字符串是不可变的,因此每次使用该方法时,都必须创建一个新字符串。每次替换调用也必须遍历整个字符串。这显然是低效的,尽管在此规模上并不明显。 一种替代方法是使用列表组合(docs,tutorial)一次遍历字符串并创建一个新字符列表。该方