当前位置: 首页 > 知识库问答 >
问题:

Doc4j-使用文档中的表格将docx转换为PDF时出现问题

宦源
2023-03-14

我刚刚尝试通过docx4j的示例webapp获取docx文档:http://webapp.docx4java.org/OnlineDemo/docx_to_pdf_fop.html生成的PDF文件的表格格式不正确。事实上,表格明显不正确……

我只是想知道这是因为docx4j不正确支持表格还是某种错误。如果是这样,如果有人能给我指出正确的信息。

共有1个答案

伯丁雷
2023-03-14

https://github.com/plutext/docx4j/blob/master/docx4j-samples-docx4j/sample-docs/tables.docx 是我们可以处理的各种表功能的一个示例。

没有看到您的docx(并且在您的差异问题中没有任何描述!),我会说要么:

> < li>

您正在使用一些我们尚不支持的表格功能,或者

如果文件长达30页,或其文档。xml长度超过300KB时,将使用更快的“非XSLT”代码。此代码还没有功能奇偶校验。

2020年9月更新

在某些情况下,在docx4j世界中,有3种主要方法可以将docx转换为PDF:

  • 较旧/令人愉悦的方法:使用 docx4j-export-fo(这是这里讨论的 XSL FO 方法,也是该表示例文档的用途)
  • 使用本地或远程运行的微软Word,由文档4j驱动。在 docx4j 8.2.0 中,请参阅 https://github.com/plutext/docx4j/tree/master/docx4j-samples-documents4j-local/src/main/java/org/docx4j/samples/documents4j/local 或 -remote 子项目。
  • 使用微软图形。在 docx4j 8.2.3 中,请参阅 https://github.com/plutext/docx4j/tree/master/docx4j-samples-conversion-via-microsoft-graph/src/main/java/org/docx4j/samples/graph_convert 的示例,这使用 https://github.com/plutext/java-docx-to-pdf-using-Microsoft-Graph

docx4j 将自动使用导出-fo,如果罐子位于您的类路径上。

有关这些方法的比较,请参见https://www.docx4java.org/blog/2020/09/office-pptxxlsxdocx-to-pdf-to-in-docx4j-8-2-3/

 类似资料:
  • 我现在正在解析一个26页的文件。带有图像、表格、斜体和下划线的docx。我能清除 我使用ApachePOI创建了带有XWPF段落列表的XWPF文档格式。当我遍历XWPF段落时,如果一个段落包含不同的样式,我无法获得各行的样式(斜体、下划线、粗体)。 我尝试过使用XWPF。段落getrun()。XWPF。。。跑getfamilyfont()我将得到null。但是当我运行XWPF时,我在段落级别获得数

  • 我正试图用Docx4J将一个DOCX文件转换为PDF,并收到两个不同文档的两个不同的异常。 1)对于文档1,第一个文档的org.docx4j.utils.singletRaversAlutilVisitorCallback.apply(SingletRaversAlutilVisitorCallback.java:27)中出现一个NullPointerException。 下面包含的代码是否是在P

  • 我正在努力寻找用Python将PDF文件转换为.docx文件的方法。 我见过其他与此相关的帖子,但在我的情况下,它们似乎都不正常。 我特别使用 这给了我输出[1],但在我的文件夹中找不到任何.docx文档。 我已经安装了LibreOffice 5.3。 有什么线索吗? 提前谢谢你!

  • 我正在尝试使用他们网站上提供的Docx4j社区包将一个Word文件转换成PDF。(http://www . docx 4 Java . org/docx 4j/docx 4j-community-3 . 3 . 1 . zip) 看起来这个包上的docx4j和FOP之间存在版本不兼容问题,我想知道以前是否有人遇到过这个问题,您是否知道什么版本的库可以实现这个功能。 这是我的代码: 我复制了下面的s

  • 我花了大量的时间试图确定到底出了什么问题,使用LibreOffice将pdf转换为docx(以及doc转换为docx)的代码。 我使用了两个windows run接口来测试运行一些我发现相关的代码,也尝试了python,但两者都不起作用。 我在Windows上安装了LibreOffice v6.0.2。 我一直在使用此代码的变体尝试将某些pdf文件转换为与特定pdf文件不相关的docx: 我已经在

  • 我需要将docx转换成pdf,我正在使用docx4j-3.2.1库。生成的pdf输出中有一些格式丢失。 可以清楚地看到,有两个值得注意的问题。一个是页眉中图像的大小/尺寸,在生成的pdf中减小。它没有像输入中那样覆盖整个标题区域。 其次是字体大小似乎发生了变化(或者字体本身发生了变化) 我如何在生成的pdf中保留标题上原始图像的尺寸?有没有一些方法可以用来微调docx到pdf的转换? 任何帮助都非