问题：

对于某些情况，使用docx4j将XHTML转换为docx会丢失原始样式

凤自珍

2023-03-14

在我的测试中，我发现当将下面的html内容转换为docx时，原始样式将丢失。

<代码>

docx中的结果：没有下划线。

docx中的结果：没有下划线

docx中的结果：没有删除行

docx中的结果：没有任何缩进

docx中的结果：仅纯文本

docx结果：没有任何背景色

docx中的结果：空

docx结果：无边界

导致docx:字体设置全部丢失。

有人知道如何处理这些问题吗？或者有什么解决办法？

共有1个答案

沈英勋

2023-03-14

XHTMLImporter源代码中的注释指出，其中一些功能仍有待实现。

关于您的#4，我认为支持缩进。也许只是不适合您使用的单位？

关于你的#8表边框，有一些支持这些；谷歌搜索其他帖子。

实现下划线、删除和背景色都应该很简单。

如果您愿意这样做，我们很乐意接受拉取请求。

类似资料：

使用docx4j-3.2.1将docx转换为pdf时格式丢失

我需要将docx转换成pdf，我正在使用docx4j-3.2.1库。生成的pdf输出中有一些格式丢失。可以清楚地看到，有两个值得注意的问题。一个是页眉中图像的大小/尺寸，在生成的pdf中减小。它没有像输入中那样覆盖整个标题区域。其次是字体大小似乎发生了变化（或者字体本身发生了变化）我如何在生成的pdf中保留标题上原始图像的尺寸？有没有一些方法可以用来微调docx到pdf的转换？任何帮助都非
使用Docx4j将HTML转换为Docx

我一直在尝试使用他们的库将html内容转换为docx，我确实在运行我的应用程序后创建了一个docx文件，但它有空白内容，而html中确实有一些内容。请检查下面的代码，我已经包含了git上AndroidDocxtoHTML示例中所有必要的库。代码：我不明白我得到的空白文档的代码中缺少了什么。我为java找到了这段代码，我为android修改了这段代码。有些人建议使用夜间构建jar进行xhtml转
Docx4j将html转换为docx

我在将HTML转换为docx时遇到了新问题，它引发了异常：组织。xml。萨克斯。SAXS异常；行号：4；栏目号：73；实体“nbsp”已被引用，但未被声明正如我所理解的，这是因为docx4j认为我的文件是XML，并希望将其转换为docx但XML中只有5个预定义的实体，而nbsp等实体没有在XML中定义。如何让docx4j将超文本标记语言转换为doc，而无需在doctype中声明实体nbsp？
使用docx4j将docx部件转换为html

我有一个应用程序试图拉一些数据从数据库，然后保存在一个docx文件。这些数据的一部分是html代码，因此使用docx4j，我能够将html代码转换为docx格式。这里有一个相关的帖子。现在，我想使用docx4j将这部分文本（在docx文件的表单元格中）转换回html格式，并将html代码保存到数据库中。或者也许有更好的解决方案来完成从docx到HTML的转换？希望我说清楚了。任何提示都很感激。
使用Docx4j和PdfBox将Docx转换为image会导致OutOfMemoryError

我使用dox4j和pdfbox分两步将docx文件的第一页转换为图像，但我目前每次都得到< code>OutOfMemoryError。我已经能够确定，在调用方法时，在这个过程的最后一步抛出了异常，然而，我已经使用这个方法的第二步转换pdf一段时间了，现在没有问题，所以我不知道可能是什么原因，除非dox4j编码pdf的方式是我尚未测试或已损坏的。我尝试将替换为，并且pdf的正确呈现似乎并不比我
使用Docx4j将DOCX转换为PDF时出错

我正试图用Docx4J将一个DOCX文件转换为PDF，并收到两个不同文档的两个不同的异常。 1）对于文档1，第一个文档的org.docx4j.utils.singletRaversAlutilVisitorCallback.apply(SingletRaversAlutilVisitorCallback.java:27)中出现一个NullPointerException。下面包含的代码是否是在P

对于某些情况，使用docx4j将XHTML转换为docx会丢失原始样式

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档