当前位置: 首页 > 面试题库 >

使用Python将PDF转换为HTML

文鸣
2023-03-14
问题内容

如何使用Python将PDF文件转换为HTML?

我只是在想Google会(或似乎会)对PDF文件建立索引的行为。

我的最终目标是设置Apache以显示PDF文件的HTML,因此,向该方向发展的任何事情也将不胜感激。


问题答案:

该poppler的包提供了一个实用PDF2HTML您可能能够使用。还有一个Python绑定到libpoppler。



 类似资料:
  • 我正在努力寻找用Python将PDF文件转换为.docx文件的方法。 我见过其他与此相关的帖子,但在我的情况下,它们似乎都不正常。 我特别使用 这给了我输出[1],但在我的文件夹中找不到任何.docx文档。 我已经安装了LibreOffice 5.3。 有什么线索吗? 提前谢谢你!

  • 本文向大家介绍如何使用Python将HTML转换为PDF,包括了如何使用Python将HTML转换为PDF的使用技巧和注意事项,需要的朋友参考一下 Python提供了Pdfcrowd API v2,可将HTML文档转换为PDF。该API非常易于使用,集成仅需要几行代码。 安装 从网页/ HTML到PDF的以下3个步骤将完成转换 步骤1-下载库pdfkit 步骤2-现在下载wkhtmltopdf 对

  • 我一直在我的开发服务器中使用模块来轻松地从转换为: 但是,我在生产服务器中部署了我的应用程序,但我没有安装Excel应用程序,因此引发了以下错误: 在Python中,从转换为有什么好的替代方法吗? 我已经用PDFWriter测试了xtopdf,但是使用这个解决方案,您需要逐个读取和迭代范围并写入行。我想知道是否有一个更直接的解决方案类似于win32com。客户 谢谢

  • 问题内容: 我是一名PHP开发人员,在我的一个项目中,我需要将一些HTML文档(大约30至50页)转换为PDF文档。 我的搜索找到了以下可能的解决方案。其中包括一些PHP库和一些命令行应用程序。每种都有自己的优点和缺点。 PHP库: fpdf(需要更多的转换努力) tcpdf(需要更多的转换努力) html2fpdf http://html2fpdf.sourceforge.net html2pd

  • 我试图将pdf文件"January2019"转换成csv文件。原始的pdf只包含某些页面上的表,我正在尝试提取这些表。我遵循http://stanford.edu/~mgorkove/cgi-bin/rpython_tutorials/Using_Python_to_Extract_Tables_From_PDFs.php教程,但是当我插入: 导入PyPDF2 PDFfilename=“2019年

  • 目前我正在尝试将PDF转换为PDF/A。 然而,不知何故,我不知道我是否可以转换色彩空间,有没有办法这样做? 这是我的代码,然而: 色彩空间被添加但是在验证我得到: 对于每个页面/元素,它都经常出现。 我能做点什么来反对它吗?比如转换颜色空间?使用她的图书馆?