当前位置: 首页 > 知识库问答 >
问题:

PDFBox PDFImageWrite.write图像没有正确处理所有字符

子车峰
2023-03-14
PDDocument doc = PDDocument.load(url);
PDFImageWriter imageWriter = new PDFImageWriter();
imageWriter.writeImage(doc, imageFormat, password, 1,
        doc.getNumberOfPages(), filePrefix, imageType, resolution);

我已经尝试将文档保存为PDF,看起来不错。保存图像时,图像可能包含不正确的文本。东欧文件尤其如此,如匈牙利、波兰、捷克等

PDF显示

H-4432 NYÍREGYHÁZA-NYÍRSZŐLŐS

有没有解决办法?我需要定义代码页吗?可用字体可能有问题吗?

共有1个答案

卫博雅
2023-03-14

我的解决方案是切换到2.0快照(Aug15)。我测试过的所有文档看起来都很好。API已经更改,但在我的情况下,更改花费了5分钟。

感谢@mkl提供的信息。

 类似资料:
  • 我在Wordpress中创建了自定义图像大小,用于Wordpress默认安装的响应图像插件。我添加的图像大小为: 然后,我使用metabox.io插件从PHP构建图像,并将加载的图像设置为显示为纵向案例研究lg。然后,我使用metabox.io中的函数加载srcset,并创建了我想要更改图像的自定义大小。 结果如下所示: 我的问题是,它现在正在加载宽度和高度为768x512的风景图像,而不是加载5

  • 我有一些用MATLAB进行图像处理的代码。为了运行matlab代码,我们需要购买matlab许可证。但根据我的项目的要求,我必须使用任何开源软件。所以我想我可以把整个代码转换成Java。 用根啤酒是个好主意吗???

  • 我整理了一些代码来从图像中提取所有字符。我从左到右对字符进行排序,并尝试将每个字符裁剪到单独的图像中。并非所有字符都被正确裁剪,其中一些最终大小为零。

  • 创建了两个虚拟示例项目(dummy1.jmx和dummy2.jmx),并使用默认设置执行以下命令(JMeter 5.3默认安装,安装了所有必需的插件)。 > # 生成的报告和时间戳在仪表板和图形中看起来都很完美 **# # 生成的报告和时间戳在仪表板和图形中看起来都很完美 # 使用MergeResults插件将上述CSV文件合并为一个文件并生成HTML报告 # 发现合并的时间戳标签无效,并且生成的

  • 我正在使用安装在本地主机上的wordpress构建一个站点。 出于某种原因,我的post.php页面没有显示帖子缩略图(特色图片)。我已经确定,这是一个问题,timthumb.php这是不正确的定位图像网址。我在网上搜索了几个小时,尝试了许多解决方案,但似乎没有任何效果。 基本问题是我在blog.php文件中的这一行: My functions.php脚本将get_image_url定义如下: 在

  • 为了解决这个问题,我尝试了许多JDK版本,但似乎无论我使用哪个java,结果总是一样的。 MavenReportException:创建存档时出错:无法找到javadoc命令:未正确设置环境变量JAVA_HOME。 我跑了: 导出JAVA_HOME=/usr/lib/jvm/JAVA-8-openjdk-amd64 : MavenReportException:创建存档时出错:无法找到javado