问题：

iText 7 Html到Pdf转换并将外部文件链接到生成的Pdf

邰勇军

2023-03-14

我在合并从iText生成的两个PDF时遇到了一个问题。我是iText7的新手，我正在从html创建一个pdf，并用excel（.xls）创建另一个pdf作为pdf的嵌入文档。我想合并这2个文件。

    ByteArrayOutputStream htmlToPdfContent = new ByteArrayOutputStream();
    PdfWriter writer = new PdfWriter(htmlToPdfContent);
    PdfDocument pdf = new PdfDocument(writer);
    pdf.setTagged();
    PageSize pageSize = PageSize.A4.rotate();
    pdf.setDefaultPageSize(pageSize);
    ConverterProperties properties = new ConverterProperties();
    HtmlConverter.convertToPdf(htmlContent, pdf, properties);

    FileUtils.cleanDirectory(new File(outputDir));

    ByteArrayOutputStream pdfResult = new ByteArrayOutputStream();
    PdfWriter writerResult = new PdfWriter(pdfResult);
    PdfDocument pdfDocResult = new PdfDocument(writerResult);

    PdfReader reader = new PdfReader(new ByteArrayInputStream(htmlToPdfContent.toByteArray()));
    PdfDocument pdfDoc = new PdfDocument(reader);
    pdfDoc.copyPagesTo(1, pdfDoc.getNumberOfPages(), pdfDocResult);

    ByteArrayOutputStream pdfAttach = new ByteArrayOutputStream();
    PdfDocument pdfLaunch = new PdfDocument(new PdfWriter(pdfAttach));
    Rectangle rect = new Rectangle(36, 700, 100, 100);
    byte[] embeddedFileContentBytes = Files.readAllBytes(Paths.get(excelPath));
    PdfFileSpec fs = PdfFileSpec.createEmbeddedFileSpec(pdfLaunch, embeddedFileContentBytes, null, "test.xlsx", null, null);
    PdfAnnotation attachment = new PdfFileAttachmentAnnotation(rect, fs)
            .setContents("Click me");
    pdfLaunch.addNewPage().addAnnotation(attachment);

    PdfDocument appliedChanges = new PdfDocument(new PdfReader(new ByteArrayInputStream(pdfAttach.toByteArray())));

    appliedChanges.copyPagesTo(1, appliedChanges.getNumberOfPages(), pdfDocResult);
    try(OutputStream outputStream = new FileOutputStream(dest)) {
        pdfResult.writeTo(outputStream);
    }

13:56:05.724 [main] ERROR com.itextpdf.kernel.pdf.PdfReader - Error occurred while reading cross reference table. Cross reference table will be rebuilt.
com.itextpdf.io.IOException: Error at file pointer 19,272.
    at com.itextpdf.io.source.PdfTokenizer.throwError(PdfTokenizer.java:678)
    at com.itextpdf.kernel.pdf.PdfReader.readXrefSection(PdfReader.java:801)
    at com.itextpdf.kernel.pdf.PdfReader.readXref(PdfReader.java:774)
    at com.itextpdf.kernel.pdf.PdfReader.readPdf(PdfReader.java:538)
    at com.itextpdf.kernel.pdf.PdfDocument.open(PdfDocument.java:1818)
    at com.itextpdf.kernel.pdf.PdfDocument.<init>(PdfDocument.java:238)
    at com.itextpdf.kernel.pdf.PdfDocument.<init>(PdfDocument.java:221)
    at com.mediaocean.prisma.order.command.infrastructure.pdf.itext.PdfAttachmentLaunch.main(PdfAttachmentLaunch.java:76)
Caused by: com.itextpdf.io.IOException: xref subsection not found.
    ... 8 common frames omitted
Exception in thread "main" com.itextpdf.kernel.PdfException: Trailer not found.
    at com.itextpdf.kernel.pdf.PdfReader.rebuildXref(PdfReader.java:1064)
    at com.itextpdf.kernel.pdf.PdfReader.readPdf(PdfReader.java:543)
    at com.itextpdf.kernel.pdf.PdfDocument.open(PdfDocument.java:1818)
    at com.itextpdf.kernel.pdf.PdfDocument.<init>(PdfDocument.java:238)
    at com.itextpdf.kernel.pdf.PdfDocument.<init>(PdfDocument.java:221)
    at com.mediaocean.prisma.order.command.infrastructure.pdf.itext.PdfAttachmentLaunch.main(PdfAttachmentLaunch.java:88)
13:56:05.773 [main] ERROR com.itextpdf.kernel.pdf.PdfReader - Error occurred while reading cross reference table. Cross reference table will be rebuilt.
com.itextpdf.io.IOException: PDF startxref not found.
    at com.itextpdf.io.source.PdfTokenizer.getStartxref(PdfTokenizer.java:262)
    at com.itextpdf.kernel.pdf.PdfReader.readXref(PdfReader.java:753)
    at com.itextpdf.kernel.pdf.PdfReader.readPdf(PdfReader.java:538)
    at com.itextpdf.kernel.pdf.PdfDocument.open(PdfDocument.java:1818)
    at com.itextpdf.kernel.pdf.PdfDocument.<init>(PdfDocument.java:238)
    at com.itextpdf.kernel.pdf.PdfDocument.<init>(PdfDocument.java:221)
    at com.mediaocean.prisma.order.command.infrastructure.pdf.itext.PdfAttachmentLaunch.main(PdfAttachmentLaunch.java:88)

请指教。提前感谢！！

共有1个答案

贺高飞

2023-03-14

您对代码的更改与我对问题第一次修订版的回答中所建议的不同，您现在转换为以前未使用的PDFDocument PDF，而不是直接转换为ByteArrayOutputStream HtmlTopDfContent。

这实际上也是解决问题的一个可能的答案。因此，这里不再出现异常：

PdfReader reader = new PdfReader(new ByteArrayInputStream(htmlToPdfContent.toByteArray()));
PdfDocument pdfDoc = new PdfDocument(reader);

相反，您现在得到了一个更深入的异常，如下所示：

PdfDocument appliedChanges = new PdfDocument(new PdfReader(new ByteArrayInputStream(pdfAttach.toByteArray())));

ByteArrayOutputStream pdfAttach = new ByteArrayOutputStream();
PdfDocument pdfLaunch = new PdfDocument(new PdfWriter(pdfAttach));
[...]
pdfLaunch.addNewPage().addAnnotation(attachment);
pdfLaunch.close(); //<==== added

PdfDocument appliedChanges = new PdfDocument(new PdfReader(new ByteArrayInputStream(pdfAttach.toByteArray())));

appliedChanges.copyPagesTo(1, appliedChanges.getNumberOfPages(), pdfDocResult);
pdfDocResult.close(); //<==== added
try(OutputStream outputStream = new FileOutputStream(dest)) {
    pdfResult.writeTo(outputStream);
}

ByteArrayOutputStream htmlToPdfContent = new ByteArrayOutputStream();
PdfWriter writer = new PdfWriter(htmlToPdfContent);
PdfDocument pdf = new PdfDocument(writer);
pdf.setTagged();
PageSize pageSize = PageSize.A4.rotate();
pdf.setDefaultPageSize(pageSize);
ConverterProperties properties = new ConverterProperties();
HtmlConverter.convertToPdf(content, htmlToPdfContent, properties);

这使得htmltopdfcontent的内容成为两者输出的大杂烩，特别是不是有效的PDF。

由于不向PDF添加任何内容，因此可以安全地删除这些内容，并将上面的摘录减少到

ByteArrayOutputStream htmlToPdfContent = new ByteArrayOutputStream();
ConverterProperties properties = new ConverterProperties();
HtmlConverter.convertToPdf(content, htmlToPdfContent, properties);

类似资料：

支持Apache FOP PDF生成的外部CSS文件

ApacheFop是否支持从html文档生成PDF的外部CSS文件？我正在指定css文件路径html文件，但样式不应用于生成的pdf报告。我还尝试复制粘贴html文档中标记内的整个样式内容。仍然生成的报告不符合应用的样式。因为我是FOP的初学者，如果有人告诉我我错过了什么，我会非常棒？另一个基本问题是... Apache FOP是否支持外部css文件？
Javadocs链接到外部Javadoc

问题内容：我正在生成Javadocs。现在，我想自动将所有库和JDK类链接到该lib或JDK的官方文档。这可能吗，如果可以，我需要哪个命令行参数问题答案：解决对标准Java类的引用需要您具有Java Docs的本地副本。 JDK 7 JavaDocs可在此处的其他资源下找到。然后，运行带有选项的javadoc 。它使用您要参考的文档的URL（例如，https://docs.oracle.c
在生成PDF文件（飞碟/itexts）时将脚对齐到底部

我使用飞碟/itext生成基于HTML的PDF文件，遇到了在PDF文件中添加页眉和页脚的问题。我最终制作了一个带有theader和tfooter的HTML表，类似这样：连同css规则“table{-fs-table-page ate： page ate；}”，页眉和页脚可以正确分页。但是，我无法使页脚粘在页面底部：如果表格内容填满了页面，则页脚被推到底：有没有办法将页脚推到底，即使车身未满？
将多个PDF文件合并/转换为一个PDF

问题内容：如何将多个PDF文件合并/转换为一个大PDF文件？我尝试了以下操作，但是目标文件的内容不符合预期：我需要一个非常简单/基本的命令行（CLI）解决方案。最好的办法是，如果我可以将合并/转换的输出直接传送到管道中（就像我之前在这里提出的问题中最初尝试的那样：Linux管道（convert->pdf2ps-> lp）。问题答案：抱歉，我设法使用Google自己找到了答案，还有些运气：
Pdf到txt的转换

我有pdf格式的数据，我想把它转换成文本。我想删除图像，页眉和页脚，而数据将只以多行表格的形式保留，你能建议转换它的最佳方式吗？我尝试了Tabula和apache tika，但结果并不理想。
链接到Javadoc中的外部URL？

问题内容：就像是：问题答案：这将创建一个包含链接的“另请参阅”标题，即：将呈现为：另请参见： http : //google.com 而这：将创建一个嵌入式链接：见http://google.com

iText 7 Html到Pdf转换并将外部文件链接到生成的Pdf

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档