假设我有一个txt文件中的文本:
bla bla bla
bla bla bla
标题 Lorem ipsum dolor sat amet, consectetur adipiscing
elit, sed do eiusmod tempor incididunt ut laboure et dolore
magna aliqua。 Ut enim ad minim veniam,
条件
bla bla bla
bla bla bla
Title Sed ut perspiciatis unde omnis iste natus error sat voluptatem
accusantium doloremque laudantium, totam rem aperiam,
eaque ipsa quae ab illoinvente veritatis
条件
bla bla bla
从上面结构的文本(100行)中,我想提取以“title”开头的行,直到找到以“condition”开头的行。结果是这样的:
标题Lorem ipsum dolor坐在amet,consecte ur adipiscing elit,这是做eiusmod的诱惑偶然的劳动和多洛雷大额等价物。不允许和不允许,
标题Sed ut perspiciatis unde omennis iste natus错误请坐,总计rem periiam, eaque ipsa quae ab illo Invore veritatis
我可以用这段代码选择第一个like,但在找到单词“condition”之前,我不知道如何添加下一行。你能帮帮我吗?
outF = open("myOutFile.txt", "w")
hand = open('doubt.txt', encoding="utf8")
for line in hand:
line = line.rstrip()
if re.search('^Title',line) :
outF.write(line); outF.write("\n")
outF.write("\n")
outF.close()```
如果在第一个条件行出现之前您想要所有标题,您需要中断
循环:
for line in hand:
line = line.rstrip()
if line.startswith("Title"):
outF.writelines([line])
if line.startswith("condition"):
break
outF.close()
如果您想在标题后写所有行,直到下一个条件出现:
write = False
writelines = []
for line in hand:
line = line.rstrip()
if line.startswith("condition"):
write = False
writelines.append("\n")
if line.startswith("Title"):
write = True
if write:
writelines.append(line + " ")
outF.writelines(writelines)
outF.close()
我的项目中有这样一段代码: 没有错误,应用程序运行正常,但是变量中从来没有任何文本,我确信txt文件中有文本! 我已经尝试过不同的方法来读取文本文件(使用BufferedReader、Scanner、FileInputStream和FileReader),但都不起作用。 另外,我几乎可以肯定问题不在变量中,因为我尝试通过代码(使用运行时)打开文件,它正常打开了正确的文件。 好的,我尝试添加,但是仍
问题内容: 为了在python中处理MS Word文件,有python win32扩展名,可以在Windows中使用。我该如何在linux中做同样的事情?有图书馆吗? 问题答案: 您可以对antiword进行子过程调用。Antiword是一个Linux命令行实用程序,用于从word doc中转储文本。适用于简单文档(显然会丢失格式)。它可以通过apt(可能是RPM)获得,也可以自己编译。
问题内容: 我试图提取具有特定文本文件之间的文本: 然后将其转储到文本文件中,以便 谢谢您的帮助。 问题答案: 这对我来说足够好了。您的样本数据在一个名为“ data.txt”的文件中,输出将进入“ result.txt”
我正在寻找一个python库,能够提取一个mp3的实际数据(实际的声音/声音我们听)。我希望能够使用数据与另一个mp3文件进行比较,而不影响比特率/编码的过程。我该怎么做?
问题内容: 我会尽量保持清楚,但如果我的问题不完美,请原谅我。我有一个包含多行数据的txt文件。例: 123拉尔夫·玻色20000 200 1 2 256 ed shane 30000 100 2 4 … 我需要按顺序读取每一行,并将其传递回单独类中的方法进行处理。我知道如何通过使用StringTokenizer将每一行分解为元素。 但是,我不确定如何一次读取一行,将元素传递回另一类,然后在完成处
我目前有一个脚本,在将csv文件转换为. txt后,我用它来绘制该文件的一部分。此时,它工作得很好,除了当我将第0列中的日期更改为序数形式时(我已经这样做了,所以我可以将所有值作为浮点数读取并在第4列上执行计算),Python去掉了小时、分钟和秒。我仍然需要小时和分钟,因为当我绘制数据时,它绘制了我在一天开始时的所有点。有没有一种方法可以做到这一点,并保持时间以及日期?我尝试过将日期转换成字符串,