当前位置: 首页 > 知识库问答 >
问题:

Python:按顺序读取Word文档

阎元徽
2023-03-14

第一次使用python。我正在尝试浏览包含段落和表格的word文档。我已经弄清楚了如何使用以下代码浏览文档中的所有段落和文档中的所有表格:

for table in doc.tables:
    for row in table.rows:
        for cell in row.cells:
             print(str(paragraph.text))

for i in doc.paragraphs:
    splitstring = i.text.split(" ", 1)
    print(splitstring[0])

但我正试图找到一种方法,像任何阅读它的人一样,有序地浏览这份文件。所以如果我们有一份文件包含:

Paragraph 1
Paragraph 2
Table 1
Paragraph 3
Table 2
Paragraph 4

它会按照这个顺序读。我想这样做的原因是,根据表格后面的段落,我想对它执行不同的操作。

共有1个答案

佟翰林
2023-03-14

这取决于您是否有权访问代码中的订单信息。

在您发布的代码中有两个循环:
一个用于打印每个表的内容
一个用于打印每个段落的内容。

这些循环是按顺序执行的,但您希望交织它们的功能,如下所示:

def print_table(table):
    for row in table.rows:
        for cell in row.cells:
            print(str(cell.text))

def print_paragraph(paragraph): 
    splitstring = paragraph.text.split(" ", 1)
    print(splitstring[0])

# Main loop:
for entry in doc.entries: 

   if isinstance(entry, doc.paragraph):
       print_paragraph(entry)
   else:
       print_table(entry)

因此,您需要知道是否有权访问数据的顺序
在上面的假设代码中,数据结构是doc。条目存储表格/段落顺序。

 类似资料:
  • 我一直试图阅读word文档中的所有内容(包括表格、图片、段落)。我可以使用getBodyElementsIterator()阅读表格和段落,但它无法阅读文档中的图片。虽然我可以使用getAllPictures()单独阅读图片,但我需要按顺序阅读所有内容。 我尝试在getBodyElementsIterator()内循环时查找XWPFPicture实例,但找不到任何图像实例。 这是我得到的结果。 它

  • 问题内容: 可以说我在一个文件夹中有三个文件:file9.txt,file10.txt和file11.txt,我想按此特定顺序读取它们。谁能帮我这个? 现在我正在使用代码 它先读取file10.txt,然后读取file11.txt,然后读取file9.txt。 有人可以帮助我如何获得正确的订单吗? 问题答案: 文件系统上的文件未排序。您可以使用函数自己对生成的文件名进行排序: 请注意,您代码中的调

  • 问题内容: 如何使用python以相反的顺序读取文件?我想从最后一行读取文件。 问题答案: 在Python 3中:

  • 问题内容: 我有一个顺序文件,它是hadoop map- reduce作业的输出。在此文件中,数据以键值对的形式写入,而值本身是一个映射。我想将值读取为MAP对象,以便我可以进一步处理它。 程序输出:关键是:[this is key]值是:{abc = 839177,xyz = 548498,lmn = 2,pqr = 1} 在这里,我以字符串的形式获取值,但我希望将其作为map的对象。 问题答案

  • 我在标准Spring Boot应用程序的resources文件夹下有以下文件。Spring忙碌的profile设置为dev,属性文件的读取顺序是什么。?