当前位置: 首页 > 知识库问答 >
问题:

在Haskell中合并PDF文件

祁烈
2023-03-14

Mac上的预览应用程序允许合并多个PDF文件,尽管功能相当模糊。我正在用Haskell编写一个实用程序,它需要执行类似的任务,即将任意数量的PDF文件合并到一个新文件中。

有没有人建议从哪里入手?显然,如果有一个关于Hackage的库可以开箱即用地完成大部分工作,那将是理想的,但如果没有,那么一些关于从哪里开始的指针将非常感激。

共有2个答案

晋安国
2023-03-14

PDF文件格式没有那么复杂。Adobe有一个官方的规范文档。基本上,PDF文件包含一组编号的“对象”。你必须从每个PDF文件中获取所有的对象,重新编号以使它们是唯一的,然后你需要摆弄页面索引以使所有的页面都显示出来。

在Hackage上似乎有几个用于编写PDF文件的软件包,但我并没有看到太多可供阅读的东西。您可能想要查看 的源代码以获取想法。也是

慎风畔
2023-03-14

我正在开发pdf库,支持解析和生成。它是低级的,更高级的工具还在待办事项列表中(因为很难设计出好的高级API)。

这里有一个PDF文件的解包和解密的例子。实现PDF合并很容易,但需要熟悉PDF内部。

补充:我创建了一个在Haskell中合并PDF文件的基本示例。总共150行代码,但缺少一些特性(请参阅文件顶部的注释)。他们很容易添加,所以让我知道如果你感兴趣。

 类似资料:
  • 我想在另一个缩放的PDF页面中插入一个PDF页面。我想用iTextSharp做这个。 我有一个矢量绘图,可以导出为单页PDF文件。我想将此文件添加到其他PDF文档的页面中,就像我将图像添加到PDF文档一样。 这可能吗? 这样做的目的是在不损失质量的情况下保留放大的能力。 使用PDF矢量很难再现矢量绘图,因为它是一个极其复杂的绘图。 导出矢量绘图为高分辨率图像不是一个选项,因为我不得不在一个单独的P

  • 我正在尝试合并我的应用程序中的两个pdf文件。但我的应用程序在创建组合文件引用的时候不断出现故障。(参见代码中的注释)。有人能给我指一下这里的正确方向吗?谢了。

  • 本文向大家介绍Haskell合并排序,包括了Haskell合并排序的使用技巧和注意事项,需要的朋友参考一下 示例 有序合并两个有序列表 保留重复项: 自顶向下版本: 定义这种方式是为了清楚而非效率。 使用示例: 结果: 自下而上的版本:            

  • 问题内容: 我的概念是-网站中有10个pdf文件。用户可以选择一些pdf文件,然后选择合并以创建一个包含所选页面的pdf文件。我该如何用PHP做到这一点? 问题答案: 我以前做过 我有一个用fpdf生成的pdf,我需要在其中添加可变数量的PDF。 因此,我已经设置了fpdf对象和页面),并使用fpdi导入了文件通过扩展PDF类来添加FDPI: 基本上,这会将每个pdf转换为图像以放入您的其他pdf

  • 我想合并几个pdf文件。我该怎么做? 到目前为止,我得到的是这个。 我正在尝试使用这个程序包myokyawhtun/PDFMerger。 根据我尝试合并的文件的不同,错误也会有所不同。 如果我尝试合并同一个pdf两次,则会生成该文件,但全部为空 如果我尝试上面的代码,就会得到HTTP错误500 如果我尝试使用更多文件,就会出现tcpdi_解析器内存不足错误 底线是它似乎不起作用。 我已经尝试了其他

  • 目前我正在使用pdfbox下载我服务器上的所有pdf文件,然后使用pdfbox将它们合并在一起。它的工作非常好,但它非常慢--因为我必须下载所有的。 有没有一种方法可以直接在S3上执行所有这些?我正在试图找到一种方法来实现它,即使不是在Java也是在python中,也无法做到这一点。 我读到了以下内容: 在S3 Amazon上合并文件 null null 编辑 最后我使用 并用 实现它。我设置了最