当前位置: 首页 > 知识库问答 >
问题:

使用Python的word文档的页数

荀振国
2023-03-14

有没有办法用Python高效地获取word文档(.doc、.docx)的页数?

还有一次。odt文件

我想把它用于Linux上基于Web2py的web应用程序。

非常感谢。

共有2个答案

邴奇逸
2023-03-14

你可以读出它的价值

<Properties>
<Pages>CountValue</Pages>

来自docProps/app。docx包中的xml或

<office:document-meta>
    <office:meta>
        <meta:document-statistic meta:page-count="CountValue">

形成元。odt包中的xml。

如果这些值​​不存在(它们是可选的),您必须对整个文档进行计算,实际上执行渲染,这要困难得多

乜华翰
2023-03-14

只有那些谁搜索此博客条目......

from win32com.client import Dispatch
#open Word
word = Dispatch('Word.Application')
word.Visible = False
word = word.Documents.Open(doc_path)

#get number of sheets
word.Repaginate()
num_of_sheets = word.ComputeStatistics(2)
 类似资料:
  • 问题内容: 有没有一种方法可以使用Python有效地获取Word文档(.doc,.docx)的页数? 对于.odt文件? 我想将此用于基于Linux的Web2py的Web应用程序。 谢谢 ! 问题答案: 您可以读取该值 来自docx包中的docProps / app.xml或 在odt包中形成meta.xml。 如果这些值不存在(它们是可选的),则必须对整个文档进行计算,实际上是执行渲染,这要困难

  • 我使用自动化对Word文档进行了大量更改,然后运行了一个VBA宏,其中包括检查文档是否超过一定的页数。 我使用获取页数,但此方法返回的结果不正确。我想这是因为Word还没有更新文档的分页以反映我所做的更改。 也存在同样的问题。

  • 问题内容: 我只有几个Word文件,每个文件都有特定的内容。我想要一个显示给我的片段,或者帮助我弄清楚如何在使用Python库的同时将word文件合并为一个文件。 例如,在pywin32库中,我执行以下操作: 但是我需要在使用Python库而不是 问题答案: 如果您的需求很简单,则可以使用以下方法: 您还可以做其他事情,但这应该可以帮助您入门。 事实证明,在一般情况下,将内容从一个Word文件复制

  • 问题内容: 我想使用Python创建Word文档,但是,我想尽可能多地重用现有的文档创建代码。我目前正在使用XSLT生成HTML文件,并以编程方式将其转换为PDF文件。但是,我的客户现在要求以Word(.doc)格式提供同一文档。 到目前为止,我没有太多运气找到该问题的解决方案。有谁知道可以帮助解决此问题的开源库(或 gulp 专有解决方案)? 注意:所有可能的解决方案必须在Linux上运行。我相

  • 我有一个当前格式的文档 标题 字幕 H1 样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本 H2 样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本 H3 样本文本样本文本样本文本样本文本样本文

  • 我有一个word文档,其中包含许多由html标记定义的html文档。我想创建一个数组或范围集合,每个范围由一个html文档组成。例如,以下是Word文档: 等等。我想用一系列范围来填充rngHTMLDocs()As Range,每个范围包含每个打开和关闭html标记中的文本。 我创建了以下代码,试图遍历定义这些范围的整个文档,但它只继续选择超文本标记语言Doc 1。我想我可能以错误的方式接近整个迭