问题：

使用Apache PDFBox从PDF文件中删除加密

华景焕

2023-03-14

使用QPDF，您可以简单地从PDF文件中删除限制/加密，如下所示：

qpdf --decrypt infile outfile

我想用Java中的PDFBox做同样的事情：

PDDocument doc = PDDocument.load(inputFilename);
if (doc.isEncrypted()) {
   // remove the encryption to alter the document
}

我已经用Standard ardDecryption材质尝试过了，但是我不知道所有者密码是什么。QPDF是如何做到这一点的？

示例文档：
https://issues.apache.org/jira/secure/attachment/12514714/in.pdf

共有1个答案

孙化

2023-03-14

这就是你需要做的（灵感来自PDFBox WriteCodeDDoc命令行工具）：

if (doc.isEncrypted()) {
    try {
        doc.decrypt("");
        doc.setAllSecurityToBeRemoved(true);
    } catch (Exception e) {
        throw new Exception("The document is encrypted and we can't decrypt it.", e);
    }
}

注意：您可能必须包括充气城堡JAR。

类似资料：

使用Gradle从war中删除/删除文件

我正在使用gradle构建一个Spring Boot应用程序，我希望从war中删除文件，因为该文件将从外部加载（它运行在tomcat容器中，而不是嵌入式的）。我查看了StackOverflow和Gradle文档，试图找出该做什么，但我不知道该绑定到哪个阶段，以及在创建war之前还是之后排除该文件。处理文件似乎也有多种方法。我相信Maven使用作为等价物。
使用Apache PDFBox从PDF文档中删除OCR文本

系统中的一些PDF文档是通过扫描创建的，其中包括OCR文本。然而，OCR没有正确执行（西里尔语和拉丁语字符混淆），尽管文档看起来可以搜索，但该信息完全不正确，无法使用。在Adobe Acrobat Reader DC（或GoogleChrome）中查看PDF文档时，它会正确显示，但在使用PDF. js呈现文档的网页上，OCR文本会显示在前面，而不是原始文本的扫描图形呈现。这个想法是通过从PDF
使用pdfbox从pdf中删除不可见文本

链接到pdf 当我尝试从上面的pdf中提取文本时，我得到了在evince viewer中不可见的文本和可见的文本的混合。此外，一些所需的文本缺少查看器中没有缺少的字符，例如，“FALCONS”中的“S”和许多缺少的“½”字符。我认为这是由于不可见文本的干扰，因为在查看器中突出显示pdf时，可以看到不可见文本与可见文本重叠。有没有办法去掉不可见的文字？还是有别的解决办法？代码：输出（粗体文本为
使用pdfbox从pdf中删除不可见的文本

问题内容：链接到pdf 当我尝试从上面的pdf中提取文本时，我混合了在evince查看器中不可见的文本和可见的文本。此外，某些所需的文本缺少查看器中未缺少的字符，例如“ FALCONS”中的“ S”和许多缺少的“ 1/2”字符。我认为这是由于来自不可见文本的干扰，因为在查看器中突出显示pdf时，可以看到不可见文本与可见文本重叠。有没有办法删除不可见的文字？还是有其他解决方案？码：输出（粗体
使用PHP从文件夹中删除所有文件？

问题内容：例如，我有一个名为“ Temp”的文件夹，我想使用PHP删除或刷新此文件夹中的所有文件。我可以这样做吗？问题答案：如果要删除“隐藏”文件（如.htaccess），则必须使用
使用Apache PDFBox从PDF中删除ID字段

我需要比较PDF文档，这些文档是用iText创建的。我实际上设法比较了文件，但我发现了一个微小的差异。当在像Notepad++这样的编辑器中打开PDF文件时,我可以看到文件末尾有这样的东西：

使用Apache PDFBox从PDF文件中删除加密

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档