当前位置：首页 > 面试题库 >

如何在大型文本文件中的两个唯一单词之间提取信息

龙宣

2023-03-14

问题内容：

我大约有150个文本文件，其中填充了字符信息。每个文件包含两个唯一词（）alpha和bravo，我想提取这些唯一词之间的文本并将其写入不同的文件中。

手动地，我可以按住CTRL + F来输入两个单词，并在两个单词之间复制文本，我只想知道如何使用一个程序（最好是Python）来处理许多文件。

问题答案：

您可以为此使用正则表达式。

>>> st = "alpha here is my text bravo"
>>> import re
>>> re.findall(r'alpha(.*?)bravo',st)
[' here is my text ']

我的test.txt文件

alpha here is my line
yipee
bravo

现在使用open读取文件，而不是应用regular expressions。

>>> f = open('test.txt','r')
>>> data = f.read()
>>> x = re.findall(r'alpha(.*?)bravo',data,re.DOTALL)
>>> x
[' here is my line\nyipee\n']
>>> "".join(x).replace('\n',' ')
' here is my line yipee '
>>>

类似资料：

从文本文件中提取单词

问题内容：假设您有一个像这样的文本文件：http : //www.gutenberg.org/files/17921/17921-8.txt 有没有人有一个好的算法或开放源代码从文本文件中提取单词？如何获得所有单词，同时避免使用特殊字符，并保留诸如“ it’s”之类的内容… 我在用Java工作。谢谢问题答案：这听起来像是正则表达式的正确工作。如果您不知道如何开始，以下是一些Java代码，可以
提取2组/文件之间的唯一值

问题内容：在linux / shell env中工作，如何完成以下任务：文本文件1包含：文本文件2包含：我需要提取文件2中不在文件1中的条目。因此，在此示例中为“ 6”和“ 7”。如何从命令行执行此操作？非常感谢！问题答案：该代码的工作方式说明：如果我们正在处理file1，请跟踪我们看到的每一行文本。如果我们正在处理file2，但没有看到行文本，则打印它。详细说明：是当前文
如何从文本文件Java中读取单个单词（或一行）？

问题内容：就像标题所说的那样，我试图编写一个程序，该程序可以从文本文件中读取单个单词并将其存储到变量中。我知道如何使用或来读取单曲，但是对于我试图这样做的行不通。一旦输入了单词，我就尝试使用.equals将它们与程序中的其他String变量进行比较，因此最好将其导入为Strings。我也可以将文本文件中的整行作为字符串输入，在这种情况下，我只需要在文件的每一行中输入一个单词即可。如何从文本文件输
使用python提取文本文件中两个字符串之间的值

问题内容：可以说我有一个包含以下内容的文本文件现在，我需要编写一个Python代码，该代码将读取文本文件并将内容在“开始”和“结束”之间复制到另一个文件。我写了下面的代码。我没有获得预期的期望输出，只是开始了。我想要得到的是开始和结束之间的所有界限。不包括开始和结束。问题答案：万一您的文本文件中有多个“开始”和“结束”，这会将所有数据一起导入，不包括所有“开始”和“结束”。
重复提取文本文件Python中两个定界符之间的行

问题内容：我有以下格式的文本文件：我想提取.txt文件中DELIMITER1和DELIMITER2之间的每个s块这是我当前的无效代码：有任何想法吗？问题答案：您可以使用简化这一个正则表达式中，DOTALL标志。这也利用了非贪婪运算符，因此将找到多个DELIMITER1-DELIMITER2对的非重叠块。
从文件中提取两个模式之间的行

问题内容：我需要从一个巨大的文件中提取两个匹配模式之间的特定行。假设（文件中唯一）匹配特定内容，（文件中不唯一）匹配之后的下一个立即匹配项。然后我要提取之间的所有行，包括样本文件内容期望的输出如果您能帮助我解决这个问题，将不胜感激问题答案：这可以是一种方法：找到时，则使变量p = 1。它仅在时打印行。这是通过条件完成的。如果为true，它将执行默认的awk操作，即。否则，事实并

如何在大型文本文件中的两个唯一单词之间提取信息

相关阅读

相关文章

相关问答

相关工具

相关文档