当前位置: 首页 > 知识库问答 >
问题:

对于某些情况,使用docx4j将XHTML转换为docx会丢失原始样式

凤自珍
2023-03-14

在我的测试中,我发现当将下面的html内容转换为docx时,原始样式将丢失。

>

  • <代码>

    docx中的结果:没有下划线。

    docx中的结果:没有下划线

    docx中的结果:没有删除行

    docx中的结果:没有任何缩进

    docx中的结果:仅纯文本

    docx结果:没有任何背景色

    docx中的结果:空

    docx结果:无边界

    导致docx:字体设置全部丢失。

    有人知道如何处理这些问题吗?或者有什么解决办法?


  • 共有1个答案

    沈英勋
    2023-03-14

    XHTMLImporter源代码中的注释指出,其中一些功能仍有待实现。

    关于您的#4,我认为支持缩进。也许只是不适合您使用的单位?

    关于你的#8表边框,有一些支持这些;谷歌搜索其他帖子。

    实现下划线、删除和背景色都应该很简单。

    如果您愿意这样做,我们很乐意接受拉取请求。

     类似资料:
    • 我需要将docx转换成pdf,我正在使用docx4j-3.2.1库。生成的pdf输出中有一些格式丢失。 可以清楚地看到,有两个值得注意的问题。一个是页眉中图像的大小/尺寸,在生成的pdf中减小。它没有像输入中那样覆盖整个标题区域。 其次是字体大小似乎发生了变化(或者字体本身发生了变化) 我如何在生成的pdf中保留标题上原始图像的尺寸?有没有一些方法可以用来微调docx到pdf的转换? 任何帮助都非

    • 我一直在尝试使用他们的库将html内容转换为docx,我确实在运行我的应用程序后创建了一个docx文件,但它有空白内容,而html中确实有一些内容。请检查下面的代码,我已经包含了git上AndroidDocxtoHTML示例中所有必要的库。 代码: 我不明白我得到的空白文档的代码中缺少了什么。我为java找到了这段代码,我为android修改了这段代码。有些人建议使用夜间构建jar进行xhtml转

    • 我在将HTML转换为docx时遇到了新问题,它引发了异常: 组织。xml。萨克斯。SAXS异常;行号:4;栏目号:73;实体“nbsp”已被引用,但未被声明 正如我所理解的,这是因为docx4j认为我的文件是XML,并希望将其转换为docx但XML中只有5个预定义的实体,而nbsp等实体没有在XML中定义。如何让docx4j将超文本标记语言转换为doc,而无需在doctype中声明实体nbsp?

    • 我有一个应用程序试图拉一些数据从数据库,然后保存在一个docx文件。这些数据的一部分是html代码,因此使用docx4j,我能够将html代码转换为docx格式。这里有一个相关的帖子。 现在,我想使用docx4j将这部分文本(在docx文件的表单元格中)转换回html格式,并将html代码保存到数据库中。 或者也许有更好的解决方案来完成从docx到HTML的转换?希望我说清楚了。任何提示都很感激。

    • 我使用dox4j和pdfbox分两步将docx文件的第一页转换为图像,但我目前每次都得到< code>OutOfMemoryError。 我已经能够确定,在调用方法时,在这个过程的最后一步抛出了异常,然而,我已经使用这个方法的第二步转换pdf一段时间了,现在没有问题,所以我不知道可能是什么原因,除非dox4j编码pdf的方式是我尚未测试或已损坏的。 我尝试将替换为,并且pdf的正确呈现似乎并不比我

    • 我正试图用Docx4J将一个DOCX文件转换为PDF,并收到两个不同文档的两个不同的异常。 1)对于文档1,第一个文档的org.docx4j.utils.singletRaversAlutilVisitorCallback.apply(SingletRaversAlutilVisitorCallback.java:27)中出现一个NullPointerException。 下面包含的代码是否是在P