我正在尝试在python中创建一个程序,该程序可以在.docx文件中找到特定的单词,并返回其发生的页码。到目前为止,在浏览python-
docx文档时,我无法找到如何访问页码,甚至无法访问该编号所在的页脚。有没有一种方法可以使用python-
docx甚至只是python?否则,最好的方法是什么?
简短的答案是否定的,因为分页符是由呈现引擎插入的,而不是由.docx文件本身确定的。
但是,某些客户端<w:lastRenderedPageBreak>
在保存的XML中放置一个元素,以指示他们在上次呈现页面时中断了页面。
我不知道这样做是什么(尽管我希望Word本身可以做到)以及它的可靠性如何,但是如果您想在Python中工作,这就是我建议的方向。您可能会使用python-
docx来获取所需的lxml元素的引用(如w:document/w:body
),然后使用XPath命令或其他内容来迭代到特定页面,但只是想一想,这将是一个详细的开发过程使它工作。
如果您使用本地Windows MS Office API,则可能会得到更好的效果,因为它实际上运行Word应用程序。
如果您是在python-
docx中生成文档,则不会放置这些元素,因为它不会尝试呈现文档(也不可能)。我们也不太可能在短期内增加对w:lastRenderedPageBreak的支持;我什至不确定那会是什么样子。
如果您搜索“ lastRenderedPageBreak”和/或“ python-docx分页符”,则会在此处看到其他问题/答案,可能还会提供更多信息。
本文向大家介绍python批量替换页眉页脚实例代码,包括了python批量替换页眉页脚实例代码的使用技巧和注意事项,需要的朋友参考一下 简介 本文分享的实例代码主要通过python语言实现批量替换页眉页脚的操作功能,具体如下。 代码 总结 以上就是本文关于python批量替换页眉页脚实例代码的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋
本文向大家介绍python 获取网页编码方式实现代码,包括了python 获取网页编码方式实现代码的使用技巧和注意事项,需要的朋友参考一下 python 获取网页编码方式实现代码 然后import chardet 下面写了一个自动化检测的函数供检测Url连接,然后返回网页url的编码方式。 上面用到了chardet类的detect方法,返回字典,然后取出编码方式encoding 感谢阅读,希望能
问题内容: 我正在使用Pythonselenium来自动化我的出勤记录。一切正常,现在我想尝试通过修改源代码来尝试。我见过几篇文章,指出可以使用它对其进行修改并且适用于JavaScript,但就我而言,我需要在标记下修改源代码。我可以使用修改源代码。以下是标签的源代码: 我试图做到这一点。以下是我的代码: 但是上面的代码给了我以下错误: selenium.common.exceptions.Web
我正在使用Python selenium来自动化我的考勤输入。它的工作很好,现在我想尝试修改源代码。我看到很少的帖子说明可以使用修改它,并且它适用于JavaScript,但是在我的例子中,我需要修改标记下的源代码。我能够使用修改源代码。以下是标记的源代码: 我尝试使用来实现。下面是我的代码: 但上面的代码给了我以下错误: selenium.common.exceptions.WebDriverEx
本文向大家介绍Python get获取页面cookie代码实例,包括了Python get获取页面cookie代码实例的使用技巧和注意事项,需要的朋友参考一下 在Python中通过GET来获取页面的COOKIE是非常简单的事情,下面的代码实例演示了如何利用Python 获取COOKIE内容 代码很简单,只需要简单的几个命令即可获取
本文向大家介绍判断网页编码的方法python版,包括了判断网页编码的方法python版的使用技巧和注意事项,需要的朋友参考一下 在web开发的时候我们经常会遇到网页抓取和分析,各种语言都可以完成这个功能。我喜欢用python实现,因为python提供了很多成熟的模块,可以很方便的实现网页抓取。 但是在抓取过程中会遇到编码的问题,那今天我们来看一下如何判断网页的编码: 网上很多网页的编码格式都不一样