问题：

用Java将docx文件转换为PDF

郎河

2023-03-14

我正在寻找一些“稳定”的方法来转换从MS WORD到PDF文件的DOCX文件。从现在起，我使用OpenOffice安装作为监听器，但它经常挂起。问题是，当许多用户同时想要将SXW、DOCX文件转换成PDF时，我们会遇到这样的情况。还有其他的可能性吗？我尝试了这个网站上的示例:https://angelozerr.wordpress.com/2012/12/06/how-to-convert-docxodt-to-pdfhtml-with-java/，但是输出结果并不好（转换后的文档有错误，布局也被修改了很多）。

共有1个答案

朱睿

2023-03-14

转换的方法有很多种，常用的方法之一是使用POI和DOCX4j

InputStream is = new FileInputStream(new File("your Docx PAth"));
            WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage
                    .load(is);
            List sections = wordMLPackage.getDocumentModel().getSections();
            for (int i = 0; i < sections.size(); i++) {
                wordMLPackage.getDocumentModel().getSections().get(i)
                        .getPageDimensions();
            }
            Mapper fontMapper = new IdentityPlusMapper();
            PhysicalFont font = PhysicalFonts.getPhysicalFonts().get(
                    "Comic Sans MS");//set your desired font 
            fontMapper.getFontMappings().put("Algerian", font);
            wordMLPackage.setFontMapper(fontMapper);
            PdfSettings pdfSettings = new PdfSettings();
            org.docx4j.convert.out.pdf.PdfConversion conversion = new org.docx4j.convert.out.pdf.viaXSLFO.Conversion(
                    wordMLPackage);
            //To turn off logger
            List<Logger> loggers = Collections.<Logger> list(LogManager
                    .getCurrentLoggers());
            loggers.add(LogManager.getRootLogger());
            for (Logger logger : loggers) {
                logger.setLevel(Level.OFF);
            }
            OutputStream out = new FileOutputStream(new File("Your OutPut PDF path"));
            conversion.output(out, pdfSettings);
            System.out.println("DONE!!");

这工作完美，甚至在多个DOCX文件上试用。

类似资料：

将DOCX转换为PDF-Java

我在运行时生成了一个docx文档，我想将其转换为PDF，而无需实际将文件保存在本地 PdfConverter无效。我怎样才能做到这一点？
将HTML转换为DOCX

上面的代码给了我一个错误，如下所示线程“main”java.lang.nosuchmethoderror：org.docx4j.org.xhtmlrenderer.docx.docx.docx.docxrenderer.（ljava/lang/string；）V在org.docx4j.convert.in.xhtml.xhtmlimporterimpl.getrenderer(xhtmlimpo
使用Python将PDF转换为.docx

我正在努力寻找用Python将PDF文件转换为.docx文件的方法。我见过其他与此相关的帖子，但在我的情况下，它们似乎都不正常。我特别使用这给了我输出[1]，但在我的文件夹中找不到任何.docx文档。我已经安装了LibreOffice 5.3。有什么线索吗？提前谢谢你！
使用docx4j将docx部件转换为html

我有一个应用程序试图拉一些数据从数据库，然后保存在一个docx文件。这些数据的一部分是html代码，因此使用docx4j，我能够将html代码转换为docx格式。这里有一个相关的帖子。现在，我想使用docx4j将这部分文本（在docx文件的表单元格中）转换回html格式，并将html代码保存到数据库中。或者也许有更好的解决方案来完成从docx到HTML的转换？希望我说清楚了。任何提示都很感激。
Docx4j将html转换为docx

我在将HTML转换为docx时遇到了新问题，它引发了异常：组织。xml。萨克斯。SAXS异常；行号：4；栏目号：73；实体“nbsp”已被引用，但未被声明正如我所理解的，这是因为docx4j认为我的文件是XML，并希望将其转换为docx但XML中只有5个预定义的实体，而nbsp等实体没有在XML中定义。如何让docx4j将超文本标记语言转换为doc，而无需在doctype中声明实体nbsp？
使用Docx4j将HTML转换为Docx

我一直在尝试使用他们的库将html内容转换为docx，我确实在运行我的应用程序后创建了一个docx文件，但它有空白内容，而html中确实有一些内容。请检查下面的代码，我已经包含了git上AndroidDocxtoHTML示例中所有必要的库。代码：我不明白我得到的空白文档的代码中缺少了什么。我为java找到了这段代码，我为android修改了这段代码。有些人建议使用夜间构建jar进行xhtml转

用Java将docx文件转换为PDF

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档