问题：

docx4j:将HTML转换为docx-table格式

弓玉书

2023-03-14

null

    private void convertHtmlToDocx() throws IOException, JAXBException, Docx4JException{
        //convert back to docx 

        String inputfilepath = System.getProperty("user.dir") + "myPath";
        String baseURL = "file:///"+System.getProperty("user.dir")+"path";

        String stringFromFile = FileUtils.readFileToString(new File(inputfilepath), "UTF-8");

        String unescaped = stringFromFile;
        if (stringFromFile.contains("&lt;/") ) {
            unescaped = StringEscapeUtils.unescapeHtml(stringFromFile);         
        }      

        System.out.println("Unescaped: " + unescaped);

        // Setup font mapping
        RFonts rfonts = Context.getWmlObjectFactory().createRFonts();
        rfonts.setAscii("Century Gothic");
        XHTMLImporterImpl.addFontMapping("Century Gothic", rfonts);

        // Create an empty docx package
        WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.createPackage();

        NumberingDefinitionsPart ndp = new NumberingDefinitionsPart();
        wordMLPackage.getMainDocumentPart().addTargetPart(ndp);
        ndp.unmarshalDefaultNumbering();        

        // Convert the XHTML, and add it into the empty docx we made
        XHTMLImporterImpl XHTMLImporter = new XHTMLImporterImpl(wordMLPackage);
        XHTMLImporter.setTableFormatting(FormattingOption.IGNORE_CLASS);
        XHTMLImporter.setParagraphFormatting(FormattingOption.IGNORE_CLASS);
        XHTMLImporter.setHyperlinkStyle("Hyperlink");
        wordMLPackage.getMainDocumentPart().getContent().addAll(XHTMLImporter.convert(unescaped, baseURL) );


        wordMLPackage.save(new java.io.File(System.getProperty("user.dir") + "myPath") );

    }

共有1个答案

徐晔

2023-03-14

您的用例是通过XHTML循环的基于Web的编辑吗？

如果是这样，也许docx-html-editor会有所帮助。它通过保存往返过程中使用的状态/提示来工作。

除此之外，Word中的表要么是固定的单元格宽度，要么不是。您描述的行为是否发生在固定宽度的表中？

类似资料：

Docx4j将html转换为docx

我在将HTML转换为docx时遇到了新问题，它引发了异常：组织。xml。萨克斯。SAXS异常；行号：4；栏目号：73；实体“nbsp”已被引用，但未被声明正如我所理解的，这是因为docx4j认为我的文件是XML，并希望将其转换为docx但XML中只有5个预定义的实体，而nbsp等实体没有在XML中定义。如何让docx4j将超文本标记语言转换为doc，而无需在doctype中声明实体nbsp？
docx4j将docx转换为错误的html格式

我对docx4j样本有一些问题。我需要转换一个文件从docx在html格式和回来。我正在尝试编译ConvertInXHTMLDocument。java示例。它创建的Html文件很好，但当试图将其转换回docx时，抛出一个缺少关闭标记（META、img等）的异常。有人遇到过这个问题吗？
使用Docx4j将HTML转换为Docx

我一直在尝试使用他们的库将html内容转换为docx，我确实在运行我的应用程序后创建了一个docx文件，但它有空白内容，而html中确实有一些内容。请检查下面的代码，我已经包含了git上AndroidDocxtoHTML示例中所有必要的库。代码：我不明白我得到的空白文档的代码中缺少了什么。我为java找到了这段代码，我为android修改了这段代码。有些人建议使用夜间构建jar进行xhtml转
docx4j转换html->docx->html

(*来自http://www.docx4java.org/forums/xhtml-import-f28/html-docx-html-inserts-a-lot-of-space-t1966.html#p6791？sid=78b64a02482926c4dbdbbafbf50d0a914将在应答时更新）我已经创建了一个html测试文档，其内容如下：然后，我的代码从这个html创建一个docx
使用docx4j将docx部件转换为html

我有一个应用程序试图拉一些数据从数据库，然后保存在一个docx文件。这些数据的一部分是html代码，因此使用docx4j，我能够将html代码转换为docx格式。这里有一个相关的帖子。现在，我想使用docx4j将这部分文本（在docx文件的表单元格中）转换回html格式，并将html代码保存到数据库中。或者也许有更好的解决方案来完成从docx到HTML的转换？希望我说清楚了。任何提示都很感激。
将HTML转换为DOCX

上面的代码给了我一个错误，如下所示线程“main”java.lang.nosuchmethoderror：org.docx4j.org.xhtmlrenderer.docx.docx.docx.docxrenderer.（ljava/lang/string；）V在org.docx4j.convert.in.xhtml.xhtmlimporterimpl.getrenderer(xhtmlimpo

docx4j:将HTML转换为docx-table格式

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档