当前位置: 首页 > 知识库问答 >
问题:

使用PdfBox,如何以字节数组的形式检索PDDocument的内容?

汪深
2023-03-14

我目前正在使用PdfBox作为pdf文件编辑器应用程序的驱动程序。我需要pdf文件(PDDocument)的PdfBox表示的内容作为字节数组。有人知道怎么做吗?

共有1个答案

栾钟展
2023-03-14

我希望不会太晚。。。

ByteArrayOutputStream byteArrayOutputStream = new ByteArrayOutputStream();
document.save(byteArrayOutputStream);
document.close();
InputStream inputStream = new ByteArrayInputStream(byteArrayOutputStream.toByteArray());

瞧!你有两个输入流!

 类似资料:
  • 问题内容: 我目前正在使用PdfBox作为pdf文件编辑器应用程序的驱动程序。我需要pdf文件(PDDocument)的PdfBox表示形式的内容作为字节数组。有谁知道如何做到这一点? 问题答案: 我希望还不晚… 瞧!您已经有了两个输入流!

  • 当我试图用PDFBox读取PDF文件时,在PDDocument类上出现NoClassDefFound错误。以下是我得到的错误: 以下是生成错误的代码: 以下是我的进口商品,以防它们可能成为问题: 编辑:这是我用来从windows命令窗口运行程序的命令-

  • 问题内容: 我正在使用pdfbox库从pdf文件中提取文本内容。我可以提取所有文本,但找不到提取字体样式的方法。 问题答案: 这不是提取字体的正确方法。要读取字体,必须遍历pdf页面并提取字体,如下所示:

  • 我有一个可以从IronPython调用的C#函数。该函数返回一个字节数组,我希望将其转换为字符串进行显示和比较。 Python告诉我要将输入参数(out Byte[]DataOut)传递为类型“strongbox[array[Byte]]”,所以我用 如何将其转换为字符串? Traceback(最近调用最后):File“”,第1行,在TypeError:expected array[Byte],g

  • 问题内容: 我正在用HTML / JavaScript编写网页。我正在使用AJAX从后端下载图像。该图像表示为原始字节数组,而不是URL,因此我不能使用标准方法。 如何向用户显示上述图像? 问题答案: 尝试将此HTML代码段放入您提供的文档中: 然后,在JavaScript方面,您可以使用所谓的Data动态修改图片的属性。 或者,使用jQuery: 假定您的图像以PNG格式存储,这是非常流行的。如

  • 我想验证创建的pdf(不是作为文件),而是作为下载到浏览器的ByteArrayOutputStream。为了避免安全问题,可以使用pdfbox preflightparser进行验证,其中preflightparser只有解析文件的选项,而不是pddocument。 //此构造函数只接受文件。 预期是验证pdf文件的飞行,而不是从系统加载。