当前位置: 首页 > 知识库问答 >
问题:

用Docx4j逐页将.docx转换为.png,将其他格式转换为png

姜俊友
2023-03-14
WordprocessingMLPackage wordMLP = Docx4J.load(new File(filepath));
    OutputStream os = new FileOutputStream(new File(fileName + ".png"));
    FOSettings settings = Docx4J.createFOSettings();
    settings.setWmlPackage(wordMLP);
    settings.setApacheFopMime(MimeConstants.MIME_PNG);
    Docx4J.toFO(settings, os, Docx4J.FLAG_NONE);
    os.close();

共有1个答案

黄逸清
2023-03-14

您可以通过将docx转换为pdf,然后逐页获取png来实现

您可以为此使用pdfbox。pdfbox是一个可以用来读取/操作pdf文件的库。有关pdfbox的更多信息https://pdfbox.apache.org/

逐页将pdf转换为png的示例代码-https://stackoverflow.com/a/23327024/5202960

 类似资料:
  • 我在将HTML转换为docx时遇到了新问题,它引发了异常: 组织。xml。萨克斯。SAXS异常;行号:4;栏目号:73;实体“nbsp”已被引用,但未被声明 正如我所理解的,这是因为docx4j认为我的文件是XML,并希望将其转换为docx但XML中只有5个预定义的实体,而nbsp等实体没有在XML中定义。如何让docx4j将超文本标记语言转换为doc,而无需在doctype中声明实体nbsp?

  • 我对docx4j样本有一些问题。我需要转换一个文件从docx在html格式和回来。我正在尝试编译ConvertInXHTMLDocument。java示例。它创建的Html文件很好,但当试图将其转换回docx时,抛出一个缺少关闭标记(META、img等)的异常。有人遇到过这个问题吗?

  • 我一直在尝试使用他们的库将html内容转换为docx,我确实在运行我的应用程序后创建了一个docx文件,但它有空白内容,而html中确实有一些内容。请检查下面的代码,我已经包含了git上AndroidDocxtoHTML示例中所有必要的库。 代码: 我不明白我得到的空白文档的代码中缺少了什么。我为java找到了这段代码,我为android修改了这段代码。有些人建议使用夜间构建jar进行xhtml转

  • 我的目标是采取现有的措施。docx文件,并使用docx4j将其从Linux命令行转换为PDF(http://www.docx4java.orghttp://www.docx4java.org).入门指南(http://www.docx4java.org/svn/docx4j/trunk/docx4j/docs/Docx4j_GettingStarted.html)指的是最新(2.8.1)软件包中实

  • 我需要将docx转换成pdf,我正在使用docx4j-3.2.1库。生成的pdf输出中有一些格式丢失。 可以清楚地看到,有两个值得注意的问题。一个是页眉中图像的大小/尺寸,在生成的pdf中减小。它没有像输入中那样覆盖整个标题区域。 其次是字体大小似乎发生了变化(或者字体本身发生了变化) 我如何在生成的pdf中保留标题上原始图像的尺寸?有没有一些方法可以用来微调docx到pdf的转换? 任何帮助都非