我需要使用python将.doc和.docx文件转换为.pdf。我已经看到了一些可用的答案,但它们使用的是comtypes和OpenWordApplication。我不能那样做。我寻求的是一种使用一些python库的方法,这些库保留字体、表格、标题大小和图像等,而不打开MS Word或LibreOffice或类似的东西,如果需要的话,将.doc和.docx文件转换为某种中间格式(然后将该格式转换为pdf)也可以。请帮助我理解我应该遵循的代码或指导说明(我不是python专家)。
我之前也遇到过类似的问题,
我的建议是:
抱歉,没有这样的直接python库来处理微软办公格式特别(. doc)
因此,如果windows的“soffice.exe”在命令行中使用LibreOffice将文档转换为.PDF而不打开LibreOffice,那么尝试在Ubuntu的“LibreOffice”中使用LibreOffice作为服务
而且它的简单和快速太多,给几乎完美的文件转换。
样本:
对于Windows:
C:\Program Files (x86)\LibreOffice 4\program\soffice.exe" --headless --convert-to pdf "input_file_path" --outdir "output_dir_path"
这将在给定的输出目录中将输入文件转换为pdf,而无需打开LibreOffice,只需将其用作服务。
要从python运行此命令,可以使用类似“子流程”的库。
我花了大量的时间试图确定到底出了什么问题,使用LibreOffice将pdf转换为docx(以及doc转换为docx)的代码。 我使用了两个windows run接口来测试运行一些我发现相关的代码,也尝试了python,但两者都不起作用。 我在Windows上安装了LibreOffice v6.0.2。 我一直在使用此代码的变体尝试将某些pdf文件转换为与特定pdf文件不相关的docx: 我已经在
问题内容: 我正在寻找一种使用PHP将Word和Excel文件转换为PDF的方法。 这样做的原因是,我需要能够将各种格式的文件合并到一个文档中。我知道,如果我能够将所有内容转换为PDF,则可以使用PDFMerger(使用fpdf)将PDF合并为一个文件。 我已经能够从其他文件类型/图像创建PDF,但仍受Word Docs困扰。(我想我可以使用已经用于从html代码创建Excel文件的PHPExce
我正在努力寻找用Python将PDF文件转换为.docx文件的方法。 我见过其他与此相关的帖子,但在我的情况下,它们似乎都不正常。 我特别使用 这给了我输出[1],但在我的文件夹中找不到任何.docx文档。 我已经安装了LibreOffice 5.3。 有什么线索吗? 提前谢谢你!
我正在寻找一些“稳定”的方法来转换从MS WORD到PDF文件的DOCX文件。从现在起,我使用OpenOffice安装作为监听器,但它经常挂起。问题是,当许多用户同时想要将SXW、DOCX文件转换成PDF时,我们会遇到这样的情况。还有其他的可能性吗?我尝试了这个网站上的示例:https://angelozerr.wordpress.com/2012/12/06/how-to-convert-doc
问题内容: 我看到一些页面允许用户上传并返回文件,例如PdfToWord 是否可以使用Python或任何Unix命令将文件转换为文件? 提前致谢 问题答案: 如果您安装了LibreOffice 如果要为此使用Python:
问题内容: 我想尝试使用documents4j来将doc转换为PDF。我在http://documents4j.com/#/develop遵循这些说明 。当我键入然后按Enter时,一切似乎都正常运行,但是我明白了 我试图删除C:\ Users \ My User.m2文件夹,但是它不起作用。对于这个简单的问题,我感到很抱歉,但是我对maven还是很陌生,我不知道这可能是问题所在,也许是docum