当前位置: 首页 > 知识库问答 >
问题:

将docx的一部分提取到新的docx中

谷梁涵忍
2023-03-14
Doc = docx.Document('/tmp/input.docx')
OutDoc = docx.Document()

for para in Doc.paragraphs:
    currentParagraph = OutDoc.add_paragraph(style=para.style)
    for run in para.runs:
        currentParagraph.add_run(run.text, style=run.style)
OutDoc.save('/tmp/output.docx')

尽管我复制了所有样式信息,但似乎我缺少了一些东西,因为输出缺少一些格式。

共有1个答案

秦禄
2023-03-14

在Word中,如果新文档中没有显式定义应用于段落或运行(或任何其他内容)的样式名称,则该样式名称将被忽略。

您可以解析源文档中的样式并在新文档中重新创建每个样式,也可以为已经包含所需样式的新文档创建一个空白“模板”文档。

“默认”python-docx文档模板包括许多内置样式,但是如果文档使用任何定制样式,这就可以解释您所看到的症状。

 类似资料:
  • 使用OpenXML(C#)解析*. docx文档有一个问题。 下面是我的步骤: 1。加载*。docx文档 2。接收段落列表 3。在每个段落中查找文本、图像和表格元素 4。为每个文本和图像元素创建html标记 5。将输出另存为*。html文件 我已经了解了如何在文档中定位图像文件并将其解压缩。现在有一个步骤要做——找到表格在文本(段落)中的位置。 如果有人知道如何在*中定位表。docx文档使用Ope

  • 您好,我正在尝试将一个表从一个docx文件复制到另一个docx文件,但实际情况是,该表的值在新文档中的表下方和表外部被复制(请参见下面的图片) Talbe在新的docx里 正如您所见,表的值被复制到表的外部。我使用的是Libre Office,ApachePOI版本3.17,我的电脑运行的是Ubuntu 16.04 我用来执行复制的代码如下

  • 我正在使用库python-docx解析docx文件。我需要阅读文档和段落的标题,但是我在文档中找不到任何关于文档标题的东西。有关于将标头写入新文件的文档,但没有关于读取标头的文档。有办法做到这一点吗?

  • 您好,我目前正在尝试编写一个结合docx文件的代码。这些文件可能包含文本、图像、表格或方程式。代码旨在复制这些对象并将它们附加到基本docx。我可以使用docx模块的“添加图片”和“添加段落”方法复制和合并文本、图像和表格,但我无法对word公式执行此操作。我决定尝试深入研究docx的xml,并从那里复制等式部分。我可以将公式附加到我的基本文档中,但是当我继续附加图片、文本和表格时,这些公式会显示

  • 我正在使用CloudConvert.com将ASP.NET MVC站点中的HTML报表转换为Docx文件。它工作得很好,只是我不知道如何让结果的Docx使用HTML中的分页符。我尝试过的事情: 所有这些在浏览器中打印时都会导致分页,但似乎都不会对CloudConvert.com创建的docx产生任何影响。关于CloudConvert的文档在涉及到像这样的特定转换时还有很多需要的地方。

  • DocX是一个以非常直观简单的方式操作Word 2007/2010文件的轻量级.NET组件。它的速度非常快,而且不需要安装微软的Office软件。