当前位置: 首页 > 知识库问答 >
问题:

如何移动PDF中的文本块(使用PDFBox)

荆亦
2023-03-14

我目前正在尝试用PDFBox生成一些手动封面的PDF,我想知道是否有可能在我的PDF中获取一个精确的文本区域并根据我的曼努埃尔厚度将其移动(向左)(这将由我的手册将有的页数决定)

我很好地创建了我的PDF文件,但我没有找到一种只获取一块文本的方法。

是否可以使用PDFBox这样做?

注意:我试着在网上和其他问题上搜索,但没有一个有用。

谢啦

共有2个答案

萧玮
2023-03-14

正如我在评论中所说,我们决定创建一个包含所需信息的新PDF,而不是试图编辑现有的PDF。

我们试图编辑PDF,但在静脉中,当我们决定从头开始时,这样做要容易得多。

感谢那些试图帮助我的人!

淳于俊迈
2023-03-14

将saveGraphicsState()和restoreGraphicsState()包裹在该块周围。在其中,使用moveTextPositionByAmount()(在起始文本()之后!)或setText转换()或(更一般的)concatenate2CTM(1,0,0,1, tx, ty)移动位置。

 类似资料:
  • 我正在尝试将pdf字段与行中的第一个字段对齐。我能得到磁场和它的位置。我也可以在本地更改它,但当我保存pdf时,字段显示在同一位置。以下是代码:

  • 请不要使用“tika”作为答案。我已经尝试了这个问题的答案: 如何从PDF文件中提取文本? 我有这个PDF文件,https://drive.google.com/file/d/1aUfQAlvq5hA9kz2c9CyJADiY3KpY3-Vn/view?usp=sharing,我想复制文本。 输出为“提交日期:2019-10-21 16:03:36.093 |表单键:5544”,这只是文本的一部分

  • 我使用Apache pdfbox来提取文本。我可以从pdf中提取文本,但我不知道如何知道这个词是否加粗???(代码建议很好!!!)下面是从pdf中提取纯文本的代码,效果很好。

  • 问题内容: 我想使用Apache PDFBox从给定的PDF文件中提取文本。 我写了这段代码: 但是,出现以下错误: 我在类路径中添加了pdfbox-1.8.5.jar和fontbox-1.8.5.jar。 编辑 我添加到程序的开头。 我运行了它,然后出现了与上述相同的错误,并且未出现在控制台中。 因此,我认为我对类路径或其他东西有疑问。 谢谢。 问题答案: 我执行了您的代码,它工作正常。也许您的

  • 问题内容: 我正在使用Apache pdfbox提取文本。我可以从pdf中提取文本,但我不知道该单词是否为粗体?(代码建议会很好!!!)这是从pdf提取纯文本的代码,可以正常工作。 问题答案: 的结果是纯文本。因此,将其提取后为时已晚。但是,您可以覆盖某些方法,只允许根据您的意愿格式化的文本通过。 在这种情况下,您必须覆盖 在您的替代中,您检查所讨论的文本是否满足您的要求(包含有关所讨论文本的很多

  • 我有一些pdf文件,使用pdfbox我已经将它们转换为文本并存储到文本文件中,现在我要从文本文件中删除它们 超链接 我希望按如下方式逐行获取有效文本: 我们提出了一种从纯文本中提取的多词概念词进行本体学习的方法OntoGain。OntoGain遵循一个由不同处理层定义的本体学习过程。在普通术语提取的基础上,通过对提取的概念进行聚类,形成概念层次结构。然后,衍生术语“分类法”将丰富非分类关系。已经研