问题：

使用Docx4j将HTML转换为Docx

姬熙云

2023-03-14

我一直在尝试使用他们的库将html内容转换为docx，我确实在运行我的应用程序后创建了一个docx文件，但它有空白内容，而html中确实有一些内容。请检查下面的代码，我已经包含了git上AndroidDocxtoHTML示例中所有必要的库。

代码：

// HTML Code
String html = "<html><head><title>Import me</title></head><body><p>Hello World!</p></body></html>";

WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.createPackage();
AlternativeFormatInputPart afiPart = new AlternativeFormatInputPart(new PartName("/hw.html"));
afiPart.setBinaryData(html.getBytes());
afiPart.setContentType(new ContentType("text/html"));
Relationship altChunkRel = wordMLPackage.getMainDocumentPart().addTargetPart(afiPart);

// .. the bit in document body
CTAltChunk ac = Context.getWmlObjectFactory().createCTAltChunk();
ac.setId(altChunkRel.getId() );
wordMLPackage.getMainDocumentPart().addObject(ac);

// .. content type
wordMLPackage.getContentTypeManager().addDefaultContentType("html", "text/html");

我不明白我得到的空白文档的代码中缺少了什么。我为java找到了这段代码，我为android修改了这段代码。有些人建议使用夜间构建jar进行xhtml转换。我需要用这个吗？

共有1个答案

薛弘壮

2023-03-14

替代格式InputPart实际上不会将您的超文本标记语言转换为正常的docx内容。

这取决于显示docx的应用程序（大多数都不能）。

相反，可以考虑使用docx4j ImportXHTML进行转换。

类似资料：

Docx4j将html转换为docx

我在将HTML转换为docx时遇到了新问题，它引发了异常：组织。xml。萨克斯。SAXS异常；行号：4；栏目号：73；实体“nbsp”已被引用，但未被声明正如我所理解的，这是因为docx4j认为我的文件是XML，并希望将其转换为docx但XML中只有5个预定义的实体，而nbsp等实体没有在XML中定义。如何让docx4j将超文本标记语言转换为doc，而无需在doctype中声明实体nbsp？
使用docx4j将docx部件转换为html

我有一个应用程序试图拉一些数据从数据库，然后保存在一个docx文件。这些数据的一部分是html代码，因此使用docx4j，我能够将html代码转换为docx格式。这里有一个相关的帖子。现在，我想使用docx4j将这部分文本（在docx文件的表单元格中）转换回html格式，并将html代码保存到数据库中。或者也许有更好的解决方案来完成从docx到HTML的转换？希望我说清楚了。任何提示都很感激。
如何使用docx4j将HTML转换为.docx？[关闭]

null 很抱歉，我无法发布我尝试过的任何内容，因为我还没有在此任务上尝试过任何内容，尽管我使用将从获得的转换为，以便在应用程序的中输出。请开导我，我在压力和困惑中迷失了……！
docx4j:将HTML转换为docx-table格式

null
docx4j转换html->docx->html

(*来自http://www.docx4java.org/forums/xhtml-import-f28/html-docx-html-inserts-a-lot-of-space-t1966.html#p6791？sid=78b64a02482926c4dbdbbafbf50d0a914将在应答时更新）我已经创建了一个html测试文档，其内容如下：然后，我的代码从这个html创建一个docx
docx4j将docx转换为错误的html格式

我对docx4j样本有一些问题。我需要转换一个文件从docx在html格式和回来。我正在尝试编译ConvertInXHTMLDocument。java示例。它创建的Html文件很好，但当试图将其转换回docx时，抛出一个缺少关闭标记（META、img等）的异常。有人遇到过这个问题吗？

使用Docx4j将HTML转换为Docx

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档