当前位置: 首页 > 知识库问答 >
问题:

合并存储在AmazonS3上的pdf文件

姜明贤
2023-03-14

目前我正在使用pdfbox下载我服务器上的所有pdf文件,然后使用pdfbox将它们合并在一起。它的工作非常好,但它非常慢--因为我必须下载所有的。

有没有一种方法可以直接在S3上执行所有这些?我正在试图找到一种方法来实现它,即使不是在Java也是在python中,也无法做到这一点。

我读到了以下内容:

在S3 Amazon上合并文件

null

null

编辑

最后我使用 并用 实现它。我设置了最多8个工作线程从S3下载所有的pdf文件。

一旦所有文件被下载,我将它们与PDFBOX合并。很简单。

共有1个答案

龙亮
2023-03-14

null

如果您不想自己创建EC2实例,那么另一种选择可能是使用AWS Lambda,这是一种计算服务,您可以在其中上传代码并让AWS管理代码的执行。

 类似资料:
  • 我有一本书的多份副本。不同用户评论的pdf文档。我想把所有这些评论合并成一个新的pdf“合并”。 我在一个名为“路径”和“目录”属性的文档类中编写了这个子类。 这段代码导致了一个我无法解决的异常。 iText。内核PDFEException:“Pdf间接对象属于其他Pdf文档。将对象复制到当前pdf文档。' 要执行此任务,我需要更改什么?还是我完全摆脱了我的代码块?

  • 关于 Photoshop PDF 格式 您也可以使用“存储为”命令以 Photoshop PDF 格式存储 RGB、索引颜色、CMYK、灰度、位图模式、Lab 颜色和双色调的图像。由于 Photoshop PDF 文档可以保留 Photoshop 数据,如图层、Alpha 通道、注释和专色,因此可以在 Photoshop CS2 或更高版本中打开文档并编辑图像。 注意:通过对文件执行“存储为 Ph

  • Mac上的预览应用程序允许合并多个PDF文件,尽管功能相当模糊。我正在用Haskell编写一个实用程序,它需要执行类似的任务,即将任意数量的PDF文件合并到一个新文件中。 有没有人建议从哪里入手?显然,如果有一个关于Hackage的库可以开箱即用地完成大部分工作,那将是理想的,但如果没有,那么一些关于从哪里开始的指针将非常感激。

  • 我想在另一个缩放的PDF页面中插入一个PDF页面。我想用iTextSharp做这个。 我有一个矢量绘图,可以导出为单页PDF文件。我想将此文件添加到其他PDF文档的页面中,就像我将图像添加到PDF文档一样。 这可能吗? 这样做的目的是在不损失质量的情况下保留放大的能力。 使用PDF矢量很难再现矢量绘图,因为它是一个极其复杂的绘图。 导出矢量绘图为高分辨率图像不是一个选项,因为我不得不在一个单独的P

  • 问题内容: 使用该插件,我将创建一个文件并基于单击按钮生成下载。我想将文件保存到服务器上,而不是启动下载。因此,当单击按钮时,我希望将文件保存在: 我知道我需要使用将文件发布到服务器。但是,查看文档并没有看到对任何数据类型的支持。 我的代码: 基于此xml文档保存示例,我尝试了以下操作: 这将下载文件而不是保存文件。如何保存文件? 问题答案: 我设法使用来解决此问题,方法如下: upload.ph

  • 我正在尝试合并我的应用程序中的两个pdf文件。但我的应用程序在创建组合文件引用的时候不断出现故障。(参见代码中的注释)。有人能给我指一下这里的正确方向吗?谢了。