当前位置: 首页 > 知识库问答 >
问题:

阅读PDF的简单方法,接受文本,并写入一个新的PDF。(Java)

蔚元明
2023-03-14

免责声明:我一直在尝试使用iText执行此操作。我读过,研究过,询问过,质疑过,实验过,做了我所能想到的一切来使这件事奏效。我被激怒了。请不要以为我没有试过就来这里,这样我就可以让别人来为我做这件事;事实并非如此。我想学,我想弄明白。我想从有此经验的人那里寻找一个好的方向。

我有一个包含可编辑文本字段的PDF。我想做的是以编程方式读取PDF文件,从已经存在的文本字段中获取文本,从应用程序中的其他地方获取文本,并将以前的信息+新的文本信息写回原始PDF文件。

我尝试过的内容:
-使用PdfReader读取PDF
-使用PdfStamper(PdfReader,FileOutputStream)写入PDF
-使用reader.getAcroFields()获取文本字段。

我已经在网上搜索了好几天了,我不能解决这个问题。当我这样做时:

String in = "C:/Users/me/Desktop/file.pdf";
String out = "C:/Users/me/Desktop/file.pdf";
PdfReader reader = new PdfReader(in);
PdfStamper stamper = new PdfStamper(reader, new FileOutputStream(out));
AcroFields form = stamper.getAcroFields();
form.setField("dateDisc1", "5/21");

它最终创建了一个损坏的PDF(file.PDF)。

如果有一个更简单的方法来做这件事,请帮我在这上面点亮一些光。

共有1个答案

叶举
2023-03-14

是啊,对不起,我没注意到文件名。

原答案:

好吧,没有一个简单的方法,我在几个月前就发现了。

它不像LaTeX,PostScript是用于打印机的,它有一个堆栈,你可以在其中推送状态等,每个字母的位置都是绝对的,PostScript是一组用于打印机然后解释的虚拟机的指令。

文字的高光和这样的来自于一个更高的知识,即文字从左到右流动等等。我读了后记标准,得到了我想要的东西,从那以后再也没有接触过它,这不是一个伟大的anwer,但肯定会给你指明正确的方向。

记住PDF和PostScript(文档)不是用来编辑的,它们不做文字换行之类的,如果你缩放你必须平移,它们的存在是为了保存格式,用于打印机之类的。

 类似资料:
  • 我使用此代码将pdf转换为文本。 我已经创建了主目录并将源文件粘贴到其中。 我得到的输出是 并且没有创建带有. txt的文件。问题在哪里?

  • 本文向大家介绍PHP实现在线阅读PDF文件的方法,包括了PHP实现在线阅读PDF文件的方法的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了PHP实现在线阅读PDF文件的方法。分享给大家供大家参考。具体实现方法如下: 为了更好地用户体验,建议你前端采用 FlexPaper在线显示文档组件来显示你的文档,先用PDF2SWF工具将你的pdf转成flash文件,然后用 FlexPaper来显示转换

  • 问题内容: 我有一个很大的PDF文件,它是建筑物的平面图。它具有用于所有办公家具的图层,包括座位位置的文本框。 我的目标是使用PHP读取此文件,在文档中搜索文本层,获取其内容和文件中的坐标。这样,我可以绘制出座位位置-> x / y坐标。 有没有办法通过PHP做到这一点?(如果需要的话,甚至可以是Ruby或Python) 问题答案: 签出FPDF(使用FPDI): http://www.fpdf.

  • 需要解析一个PDF文件,以便只提取最初的文本行,并寻找不同的Python包来完成这项工作,但没有任何运气。 尝试过: tika,它给出了不同的终端错误消息,并且非常慢 pdftotext安装失败 pdf2text在“导入pdf2text”时失败,并且当更改为“pdftotext”时,即使通过显示安装了“extractor”,也无法使用“importerror:无法导入名称'extractor'”导

  • 本文向大家介绍Java 读取PDF中的文本和图片的方法,包括了Java 读取PDF中的文本和图片的方法的使用技巧和注意事项,需要的朋友参考一下 本文将介绍通过Java程序来读取PDF文档中的文本和图片的方法。分别调用方法extractText()和extractImages()来读取。 使用工具:Free Spire.PDF for Java(免费版) Jar文件获取导入: 方法1:通过官网下载j

  • Android PDF Viewer 是Android平台下的PDF阅读器。