问题：

iText7:PdfDictionary过早发布

乜元魁

2023-03-14

对于某些PDF，我在刷新标记结构时看到一个NPE。这个问题发生在iText 7.0.2-Snapshot中。iText 5.5.10可以很好地处理这些文件。NPE在pdfdictionary.get（PdfName键，布尔asDirect)中抛出，因为映射是空的。该类中的映射只有在调用releaseContent()时才能变为null。

因为releaseContent()的唯一目的是--就我所知--释放内存，所以我测试了当它更改为空方法时会发生什么。结果是文件似乎正常处理。不再有例外。下面是一个示例文件。

protected void releaseContent() {
    List<Integer> objs = Arrays.asList(6888, 6856, 6824, 844, 836);
    if (objs.contains(indirectReference.objNr)) {
        return;
    }
    map = null;
}

PdfReader reader = new PdfReader(src);
PdfWriter writer = new PdfWriter(dest);
PdfDocument doc = new PdfDocument(reader, writer);
doc.close();`

输出是什么：

Exception in thread "main" com.itextpdf.kernel.PdfException: Tag structure flushing failed: it might be corrupted.
at       com.itextpdf.kernel.pdf.PdfDocument.tryFlushTagStructure(PdfDocument.java:1746)
at com.itextpdf.kernel.pdf.PdfDocument.close(PdfDocument.java:727)
at perinorm.cleanPdf.MainCleanPDF.run(MainCleanPDF.java:139)
at perinorm.cleanPdf.MainCleanPDF.lambda$2(MainCleanPDF.java:58)
at java.util.stream.ForEachOps$ForEachOp$OfRef.accept(Unknown Source)
at java.util.stream.ReferencePipeline$3$1.accept(Unknown Source)
at java.util.stream.ReferencePipeline$2$1.accept(Unknown Source)
at java.util.stream.ReferencePipeline$3$1.accept(Unknown Source)
at java.util.Iterator.forEachRemaining(Unknown Source)
at java.util.Spliterators$IteratorSpliterator.forEachRemaining(Unknown Source)
at java.util.stream.AbstractPipeline.copyInto(Unknown Source)
at java.util.stream.AbstractPipeline.wrapAndCopyInto(Unknown Source)
at java.util.stream.ForEachOps$ForEachOp.evaluateSequential(Unknown Source)
at java.util.stream.ForEachOps$ForEachOp$OfRef.evaluateSequential(Unknown Source)
at java.util.stream.AbstractPipeline.evaluate(Unknown Source)
at java.util.stream.ReferencePipeline.forEach(Unknown Source)
at perinorm.cleanPdf.Main.main(Main.java:56)

Caused by: java.lang.NullPointerException
at com.itextpdf.kernel.pdf.PdfDictionary.get(PdfDictionary.java:555)
at com.itextpdf.kernel.pdf.PdfDictionary.get(PdfDictionary.java:146)
at com.itextpdf.kernel.pdf.tagging.PdfStructElem.getK(PdfStructElem.java:338)
at com.itextpdf.kernel.pdf.tagging.PdfStructElem.getKids(PdfStructElem.java:322)
at com.itextpdf.kernel.pdf.tagging.PdfStructTreeRoot.flushAllKids(PdfStructTreeRoot.java:247)
at com.itextpdf.kernel.pdf.tagging.PdfStructTreeRoot.flushAllKids(PdfStructTreeRoot.java:249)
at com.itextpdf.kernel.pdf.tagging.PdfStructTreeRoot.flushAllKids(PdfStructTreeRoot.java:249)
at com.itextpdf.kernel.pdf.tagging.PdfStructTreeRoot.flushAllKids(PdfStructTreeRoot.java:249)
at com.itextpdf.kernel.pdf.tagging.PdfStructTreeRoot.flushAllKids(PdfStructTreeRoot.java:249)
at com.itextpdf.kernel.pdf.tagging.PdfStructTreeRoot.flushAllKids(PdfStructTreeRoot.java:249)
at com.itextpdf.kernel.pdf.tagging.PdfStructTreeRoot.flush(PdfStructTreeRoot.java:184)
at com.itextpdf.kernel.pdf.PdfDocument.tryFlushTagStructure(PdfDocument.java:1744)
... 16 more

共有1个答案

窦哲彦

2023-03-14

这个问题的直接原因是，在示例文档的结构树中，一些节点被多次使用，例如。

6770 0 obj
<<
  /K [ 6873 0 R 6874 0 R 6875 0 R 6876 0 R 6877 0 R 6878 0 R 6879 0 R
       6880 0 R 6881 0 R 6882 0 R 6883 0 R 6884 0 R 6885 0 R 6886 0 R
       6887 0 R 6888 0 R 6888 0 R ]
  /P 5874 0 R
  /S /TR    
>>

如您所见，68880R在此结构树节点的子节点数组中出现了两次。

当iText 7关闭pdfdocument时，它遍历结构树并将找到的每个元素刷新到目标文档：

private void flushAllKids(IPdfStructElem elem) {
    for (IPdfStructElem kid : elem.getKids()) {
        if (kid instanceof PdfStructElem) {
            flushAllKids(kid);
            ((PdfStructElem) kid).flush();
        }
    }
}

private void flushAllKids(IPdfStructElem elem) {
    for (IPdfStructElem kid : elem.getKids()) {
        if (kid instanceof PdfStructElem) {
            if (!((PdfStructElem) kid).isFlushed())
            {
                flushAllKids(kid);
                ((PdfStructElem) kid).flush();
            }
        }
    }
}

通过此更改，示例文档将无例外地被盖章。

类似资料：

HttpServletResponse似乎会定期过早发送

问题内容：我正在进行一个将http请求（用于测试目的的GET）发送到Java Servlet的安装程序。它的工作方式是，服务程序从浏览器获取请求，进行解析，然后通过TCP套接字将其发送到“主”服务器，由“主”服务器处理请求并发送回响应。然后，该Servlet提取先前存储在ConcurrentHashMap中的HttpServletResponse，打开PrintWriter，然后将响应发送回去。
mongoDB承诺过早归还

问题内容：我刚刚开始尝试在Node.js应用程序上实现Promises。现在，我正在检查用户和密码是否存在，然后使用mongodb来查找未找到用户的用户和密码，它会设置promise.reject（），但是它返回的promise太早了，它仍然处于未决状态。如果有人可以帮助或给我有关如何重构的想法，将不胜感激。 https://gist.github.com/joshbedo/8957056 问题
django过滤器早于天？

问题内容：天是用户输入以获得比（用户输入的天数）还早的结果的数字。例如，如果用户输入32天，则他们将获得30天之前的结果。快速试用：我的问题和尝试来自输入字段的输入在我的情况下，在Django中执行此操作的最佳方法是什么？问题答案：这样的事情将为你工作：
与C编码标准相关的过早优化和过早悲观

Herb Sutter的C编码标准说要避免和。但我觉得两者都在做同样的事情。因此，希望对澄清这两个概念以及它们之间的区别有所帮助。如果你能举出一些例子，对其他人会更有好处。下面是关于
Audiosystem过早停止写入AudioInputStream

由于限制，我需要在第一次启动时下载一个wav文件。我将该文件托管在服务器上。我已经检查过了，我在服务器上有完整的文件，我也验证过了，用管道将audioinputstream输入到一个剪辑中，播放它就会播放完整的音频。现在我的问题是：如何将完整的流写入一个文件，或者我是否必须这样做，这是一种更简单的方法，可以将wav文件下载到特定的位置
MongoDB过早到达流结束

当我试图连接到MongoDB Atlas免费层时，我得到了一个过早到达流结束的错误。使用Java1.8和Mongo驱动程序3.8.0。这和Atlas中的集群设置有什么关系吗？我在MongoDB本地主机上使用了相同的程序。错误：

iText7:PdfDictionary过早发布

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档