理想情况下,我想要一个不需要超级用户访问权限即可安装的模块或库;我在工作环境中的特权有限。
OpenOffice具有RTF阅读器。您可以使用python编写OpenOffice脚本,有关更多信息,请参见此处。
您可能会尝试在Windows上使用不可思议的com-object读取任何闻到ms-binary的东西。我不建议这样做。
实际上,解析原始数据可能不会很困难,请参见以.bat
/ QBasic编写的示例。
_DocFrac
是RTF,HTML和文本之间的免费开源转换器。提供Windows,Linux,ActiveX和DLL平台。_将其包装在python中可能很容易。
RTF :: TEXT ::
Converter
-Perl扩展,用于将RTF转换为text。(以防DocFrac出现问题)。
Microsoft的正式富文本格式(RTF)规范1.7版。
祝您好运(在您的工作环境中权限有限)。
问题内容: 哪些是将PDF文件转换为文本的最佳Python模块? 问题答案:
问题内容: 我正在寻找Python的技术或模板系统,以将输出格式化为简单文本。我需要的是它将能够遍历多个列表或字典。如果我能够将模板定义为单独的文件(例如output.templ),而不是将其硬编码为源代码,那就太好了。 作为简单的示例,我想要实现的是,我们有变量,以及 在模板中运行,输出如下所示: 这该怎么做?谢谢。 问题答案: 有很多用于python的模板引擎:Jinja,Cheetah,Ge
本文向大家介绍Python中可用于将PDF转换为文本的模块有哪些?,包括了Python中可用于将PDF转换为文本的模块有哪些?的使用技巧和注意事项,需要的朋友参考一下 您可以使用PDFMiner包将PDF转换为文本。 示例 您可以通过以下方式使用它: 这将获取一个pdf文件,并使用PDFPageInterpreter类中的process_page函数逐页提取文本。 PDFMiner的替代品具有
问题内容: 我们有一个水晶报表,我们需要将其作为电子邮件发送出去,但是从水晶报表生成的HTML几乎很丑陋,并且导致某些电子邮件客户端出现问题。我想将其导出为富文本格式,并尽可能将其转换为HTML。 有什么建议么? 问题答案: 我会在CodeProject RTFConverter上签出此工具。这个家伙很好地细分了程序的工作方式以及转换的细节。
问题内容: 我在Java方面苦苦挣扎,但无法将Java .wav转换为.mp3转换器的有效示例。该转换器将在Java applet中使用,因此它应仅依赖以纯Java编写的库,而无需底层C代码调用。 谁能提供一个完整的示例? 谢谢 问题答案: 阅读您的wave文件@ http://java.sun.com/javase/technologies/desktop/media/jmf/ 并编码为mp3
问题内容: 关于使用python在Linux上将.doc,.ppt和.xls转换为纯文本的方法的任何建议?实际上,任何转换方法都是有用的。我已经考虑过使用Open Office,但是,我想要一个不需要安装Open Office的解决方案。 问题答案: 我将使用命令行解决方案(然后使用Python子过程模块从Python运行工具)。 可以在以下位置(以源代码形式)找到msword( catdoc )