如何使用python-docx替换Word文档中的文本并保存

穆远

2023-03-14

问题内容：

在同一页面中提到的oodocx模块会将用户引向一个似乎不存在的/ examples文件夹。
我已经阅读了python-docx 0.7.2的文档，以及在上可以找到的所有内容，因此请相信我已经完成了“作业”。

Python是我所知道的唯一语言（初学者+，也许是中级），所以请不要假定对C，Unix，xml等有任何了解。

任务：打开其中包含一行文本的ms-word
2007+文档（为简单起见），然后用其字典值替换该行文本中出现的“字典”中的所有“关键”词。然后关闭文档，使其他所有内容保持不变。

文字行（例如）“我们将在海浪中徘徊。”

from docx import Document

document = Document('/Users/umityalcin/Desktop/Test.docx')

Dictionary = {‘sea’: “ocean”}

sections = document.sections
for section in sections:
    print(section.start_type)

#Now, I would like to navigate, focus on, get to, whatever to the section that has my
#single line of text and execute a find/replace using the dictionary above.
#then save the document in the usual way.

document.save('/Users/umityalcin/Desktop/Test.docx')

我没有在文档中看到允许我执行此操作的任何内容-也许它在那里，但我不明白，因为并不是我所讲的一切都清楚。

我遵循了该站点上的其他建议，并尝试使用模块的早期版本（https://github.com/mikemaccana/python-
docx），该模块应该具有如下“
replace，advReplace之类的方法”： python解释器中的源代码，并在末尾添加以下内容（这是为了避免与已经安装的版本0.7.2冲突）：

document = opendocx('/Users/umityalcin/Desktop/Test.docx')
words = document.xpath('//w:r', namespaces=document.nsmap)
for word in words:
    if word in Dictionary.keys():
        print "found it", Dictionary[word]
        document = replace(document, word, Dictionary[word])
savedocx(document, coreprops, appprops, contenttypes, websettings,
    wordrelationships, output, imagefiledict=None)

运行它会产生以下错误消息：

NameError：名称“ coreprops”未定义

也许我正在尝试做一些无法完成的事情，但是如果我错过了一些简单的事情，我将感谢您的帮助。

如果这很重要，我将在OSX 10.9.3上使用Enthought的Canopy的64位版本

问题答案：

当前版本的python-
docx没有search()功能或replace()功能。这些请求被相当频繁地请求，但是一般情况下的实现非常棘手，并且尚未达到积压的顶部。

不过，有几个人已经取得了成功，可以使用已经存在的设施来完成所需的工作。这是一个例子。顺便说一句，它与各节无关：)

for paragraph in document.paragraphs:
    if 'sea' in paragraph.text:
        print paragraph.text
        paragraph.text = 'new text containing ocean'

要同时在表格中搜索，您需要使用类似以下内容的内容：

for table in document.tables:
    for cell in table.cells:
        for paragraph in cell.paragraphs:
            if 'sea' in paragraph.text:
               ...

如果您走这条路，您可能会很快发现复杂性。如果替换段落的整个文本，则将删除任何字符级格式，例如粗体或斜体字或词组。

顺便说一句，@ wnnmaw的答案中的代码适用于python-docx的旧版本，对于0.3.0之后的版本完全不起作用。

如何使用python-docx替换Word文档中的文本并保存

相关阅读

相关文章

相关问答

相关工具

相关文档