当前位置: 首页 > 知识库问答 >
问题:

PDFBox:转换为图像:转换包含扫描文档的PDF时质量损失

赵雅懿
2023-03-14

我的用例非常简单。我需要将PDF转换为图像。我尝试使用apache pdfbox,但在转换包含扫描图像的PDF时遇到了一些问题。转换扫描图像时,由于压缩/缩放,图像清晰度会降低。所以我试图从PDF中提取图像数据,然后存储它。但问题是,我可能会得到包含图像和文本的PDF文件,在这种情况下,我需要返回到图像转换模式。问题是如何区分只有图像的页面/文档和包含复合数据的页面/文档。我想我可以使用ProcSet Definition来实现这一目的,但根据PDF规范,它似乎被标记为过时和不可靠。另一种可能性是检查链接到该页面的所有对象,看看它是否包含图像以外的内容。如果有更简单的方法,请告诉我谢谢

共有1个答案

邓夕
2023-03-14

如果您的意图是将pdf转换为图像,最好使用ImageMagick。如果您使用ImageMagick,有很多选项可以更改图像的质量。使用ImageMagick将pdf转换为图像非常简单。

 类似资料:
  • 当使用PDFBox将PDF(可填充)转换为Jpeg时。复选框中的勾号将转换为方框字符 警告[org.apache.pdfbox.rendering.type1glyph2d]代码52(a20)没有字形,字体为ZapfDingbats public static void main(String[]args)引发异常{ 我如何设置字体到PDF图像代码?

  • 有人能给我举个例子,说明如何使用ApachePDFBox转换不同图像中的PDF文件(PDF的每一页对应一个图像)?

  • 我有一个docx4j生成的文件,其中包含几个表格、标题,最后还有一个excel生成的曲线图。 我尝试了许多方法,以将此文件转换为PDF,但没有得到任何成功的结果。 带有xsl fo的Docx4j不起作用,docx文件中包含的大部分内容尚未实现,并以红色文本显示为“未实现” 我在Apache POI中使用的代码如下: 我不知道该怎么做才能得到PDF中的图表,有人能告诉我如何继续吗? 提前感谢。

  • 我已经用iText创建了一个文档,我想把这个文档(保存为PDF文件)转换成一个图像。为此,我使用PDFBox,它需要一个PDDocument作为输入。我使用以下代码: 此时,我从已保存的文件中加载文档。但我希望在Java内部执行此操作。 所以我的问题是:如何将文档转换为PDDocument? 非常感谢任何帮助!

  • 问题内容: 我想将PDF文档转换为图像。我正在使用Ghost4j。 问题: Ghost4J需要gsdll32.dll文件在运行时,我也 并不 想使用的DLL文件。 问题1: 在ghost4j中,有没有办法在没有dll的情况下转换图像? 问题2: 我在PDFBox API中找到了解决方案。convertToImage()将PDF页面转换为图像格式。 PDF文档上只有文本。运行此代码时出现该异常: 问

  • 我想把PDF文档转换成图像。我用的是Ghost4j。 问题:Ghost4J需要gsdll32。dll文件,我不想使用dll文件。 问题1:是否有任何方法,在ghost4j转换图像没有dll? 问题2:我在PDFBox API中找到了解决方案<代码>组织。阿帕奇。pdfbox。pdmodel。PDPagep具有将PDF页面转换为图像格式的方法convertToImage()。 我只有PDF文档上的文