当前位置: 首页 > 知识库问答 >
问题:

使用python或宏Word进行文字处理

田权
2023-03-14

我不是一个好的程序员,老实说,在这种情况下,我找不到一个舒适的解决方案。

我有一个从视频字幕派生的文本文件,我想创建一个更方便的文本文件。我在这里插入一个gif来显示我想做什么。

我用word office VB创建了一个宏,但我并不满意。

你对此有什么建议吗?

简单的宏Word Office

Sub Macro1()
'
' Macro1 Macro
'
'
    Selection.TypeBackspace
    Selection.TypeBackspace
    Selection.TypeText Text:=" "
End Sub

中的简单文本:

a casa il curare la persona a casa
limita anche e razionalizza i costi
della sanità è il paziente e il nostro
familiare che ripeto come dicevo prima è
limitato nel suo corpo e del riciclo in
tutto l'amore di questo mondo quindi
questo è un qualcosa che noi perché per
noi deve diventare come dicevo prima un
obbligo uno stato non deve essere un
qualcosa che dobbiamo fare e siamo
obbligati a farlo chi è già sfortunato
ripeto da chi sicuramente non lo è deve
essere aiutato il tutti quanti modi
necessita per questo o per questa
problematica voi un'idea ce l'avete

简单文本输出:

在tutto l'amore di questo mundo quindi questoèun qualcosa che noi percent developer come dicevo primaèlimita nel suo corpo del ricolo个人之家有限公司(casa il curare la persona a)anche e razionalizza i costi della sanitèil paziente e e e il nostro familiete che ripeto come dicevo primaèlimita nel corpo del ricolo在tutto l'amore questo quindi questoè目标是根据需要或根据问题的数量和必要性,制定一个无需开发的开发计划


共有1个答案

范彭亮
2023-03-14

有一种方法可以做到这一点:

  1. 将整个文件读取到一个行列表中,删除行之间的换行符
with open("separate_lines.txt", "r") as file:
    lines = file.read().splitlines()

with open("merged_lines.txt", "w") as file:
    file.write(' '.join(lines) + '\n')

print('done')

这是另一种稍微复杂一点的方法,它一次一行地迭代处理文件,无需一次将整个内容读入内存:

with open("separate_lines.txt","r") as inp, open("merged_lines.txt","w") as outp:
    outp.write(next(inp).rstrip())  # Read and write first line.
    for line in inp:
        outp.write(' ' + line.rstrip())  # Write following lines prefixed with a space.
    outp.write('\n')  # End output file with a single newline.

print('done')
 类似资料:
  • 问题内容: 我只有几个Word文件,每个文件都有特定的内容。我想要一个显示给我的片段,或者帮助我弄清楚如何在使用Python库的同时将word文件合并为一个文件。 例如,在pywin32库中,我执行以下操作: 但是我需要在使用Python库而不是 问题答案: 如果您的需求很简单,则可以使用以下方法: 您还可以做其他事情,但这应该可以帮助您入门。 事实证明,在一般情况下,将内容从一个Word文件复制

  • 问题内容: 我想使用Python创建Word文档,但是,我想尽可能多地重用现有的文档创建代码。我目前正在使用XSLT生成HTML文件,并以编程方式将其转换为PDF文件。但是,我的客户现在要求以Word(.doc)格式提供同一文档。 到目前为止,我没有太多运气找到该问题的解决方案。有谁知道可以帮助解决此问题的开源库(或 gulp 专有解决方案)? 注意:所有可能的解决方案必须在Linux上运行。我相

  • 问题内容: 有没有一种方法可以使用Python有效地获取Word文档(.doc,.docx)的页数? 对于.odt文件? 我想将此用于基于Linux的Web2py的Web应用程序。 谢谢 ! 问题答案: 您可以读取该值 来自docx包中的docProps / app.xml或 在odt包中形成meta.xml。 如果这些值不存在(它们是可选的),则必须对整个文档进行计算,实际上是执行渲染,这要困难

  • 有没有办法用Python高效地获取word文档(.doc、.docx)的页数? 还有一次。odt文件? 我想把它用于Linux上基于Web2py的web应用程序。 非常感谢。

  • 问题:编写一个名为wordWrap的方法,该方法接受表示输入文件的扫描器作为其参数,并将文件的每一行输出到控制台,对超过60个字符的所有行进行文字包装。例如,如果一行包含112个字符,则方法应将其替换为两行:一行包含前60个字符,另一行包含最后52个字符。包含217个字符的行应该被包装成四行:三行的长度为60,最后一行的长度为37。 我的代码: 输出中的问题: 预期产出: 生产产量: 我哪里做错了

  • 21.3 用 make 进行宏编译 在本章一开始我们提到过 make 的功能是可以简化编译过程里面所下达的指令,同时还具有很多很方便的功能!那么下面咱们就来试看看使用 make 简化下达编译指令的流程吧! 21.3.1 为什么要用 make 先来想像一个案例,假设我的可执行文件里面包含了四个源代码文件,分别是 main.c haha.c sin_value.c cos_value.c 这四个文件,