当前位置: 首页 > 知识库问答 >
问题:

如何使用python在docx中查找列表?

左博学
2023-03-14

我正在尝试拆分一个word文档,该文档如下所示:

1.0列表项
1.1列表项
1.2列表项
2.0列表项

它存储在docx中,我正在使用python-docx尝试解析它。不幸的是,它在开始时失去了所有的编号。我试图识别每个有序列表项的开始。

python-docx库也允许我访问样式,但是我不知道如何确定样式是否是列表样式。

到目前为止,我一直在处理函数和检查输出,但标准格式类似于:

    for p in doc.paragraphs:
        s = p.style
        while s.base_style is not None:
            print s.name
            s = s.base_style
        print s.name

我一直在使用它来尝试搜索自定义样式,但都以“正常”结尾,而不是“列表号码”

我尝试在文档、段落和运行下搜索样式,但运气不佳。我也尝试过搜索p.text,但如前所述,编号不会持久。

共有1个答案

夏侯华彩
2023-03-14

列表项可以通过多种方式在XML中实现。不幸的是,使用工具栏(而不是使用样式)添加列表项的最常见方法可能也是最复杂的。

最好的办法是开始使用OPCDiag来查看文档中使用的XML。然后从中制定策略。

python-docx的列表处理API还没有真正实现,所以如果你想在今天的版本中完成这一点,你需要在lxml级别上操作。

 类似资料:
  • 问题内容: 关于你的第一个问题:该代码非常好,并且如果与其中的一个元素相等就可以正常工作。也许你尝试查找与其中一项不完全匹配的字符串,或者你使用的浮点值会导致不准确。 关于第二个问题:如果“查找”列表中的内容,实际上有几种可能的方法。 检查里面是否有东西 这是你描述的用例:检查列表中是否包含某些内容。如你所知,你可以使用in运算符: 过滤集合 即,找到满足特定条件的序列中的所有元素。你可以为此使用

  • 上周我刚开始在工作中学习Python。我正在尝试与我们的人力资源系统集成,并使用每个API将信息上传到Okta(我们的SSO提供商)。 HR API以以下格式输出一个json文件 然后,我想将它输入到一个名为的变量中,并将其放在我的代码中: 我希望遍历Result>EmployeeId>DisplayValue并将它们打印到一个dict中,然后在代码的另一部分中遍历这些

  • 我有2个系列1的联系值是列表,这个列表是第二个系列的联系索引,我称之为s1和s2 如何在s2列表的基础上找到s1列表的和而不使用for循环? 我想要的输出是这样的 谢谢

  • 本文向大家介绍在Python列表中查找最常使用的元素,包括了在Python列表中查找最常使用的元素的使用技巧和注意事项,需要的朋友参考一下 在本文中,我们将看到如何查找给定列表中最常见的元素。换句话说,频率最高的元素。 随着最大和计数 我们应用了为什么set函数获取列表的唯一元素,然后考虑列表中的每个元素。最后应用max函数获得频率最高的元素。 示例 输出结果 运行上面的代码给我们以下结果- 带柜

  • 问题内容: 我正在尝试从具有命名空间的Word文档中查找所有内容,但我不知道语法到底是什么。 这些文档仅涵盖了非常简单的情况,并加入了URN和VML组合,我似乎无法从网上看到我能看到的任何示例。有人碰巧知道这是什么吗? 我正在尝试做这样的事情: 编辑:@aneroid写的是1000%正确的答案,超级有帮助。您应该对此投票。就是说,在理解了所有内容之后- 我接受了BS4的答案,因为它完全按照我的要求

  • 如何在Python中找到列表的中值?列表可以是任何大小,并且不能保证数字按任何特定顺序排列。 如果列表包含偶数个元素,则函数应返回中间两个元素的平均值。 以下是一些示例(出于显示目的进行了分类):