当前位置: 首页 > 面试题库 >

python-查找文件中单词的出现

薛高澹
2023-03-14
问题内容

我正在尝试查找文件中出现的单词数。我有一个文本文件(TEST.txt),文件内容如下:

ashwin programmer india
amith programmer india

我期望的结果是:

{ 'ashwin':1, 'programmer ':2,'india':2, 'amith ':1}

我使用的代码是:

for line in open(TEST.txt,'r'):
    word = Counter(line.split())
    print word

我得到的结果是:

Counter({'ashwin': 1, 'programmer': 1,'india':1})
Counter({'amith': 1, 'programmer': 1,'india':1})

谁能帮帮我吗?提前致谢 。


问题答案:

使用update计数器的方法。例:

from collections import Counter

data = '''\
ashwin programmer india
amith programmer india'''

c = Counter()
for line in data.splitlines():
    c.update(line.split())
print(c)

输出:

Counter({'india': 2, 'programmer': 2, 'amith': 1, 'ashwin': 1})


 类似资料:
  • 问题内容: 我试图加快我的项目以计算单词频率的速度。我有360多个文本文件,我需要获取单词的总数以及另一个单词列表中每个单词出现的次数。我知道如何使用单个文本文件执行此操作。 要获得“通货膨胀”,“工作”,“产出”个体的频率过于繁琐。我可以将这些单词放入列表中并同时查找列表中所有单词的出现频率吗?基本上,这与Python。 示例:代替此: 我想这样做(我知道这不是真实的代码,这是我在寻求帮助的内容

  • 你好,我需要找到文件中最长的单词出现的行号。如果有两个或两个以上长度相同的单词,那么只跟踪第一个。我已经跟踪了最长的单词,但我需要帮助找出最长的单词在哪里。这是我找到最长单词的代码:

  • 问题内容: 我试图找到一个单词在一个字符串中出现的次数。 我使用以下内容来计算发生次数: 问题是我要完全匹配。因此这句话的计数将为0。这可能吗? 问题答案: 如果您要提高效率: 这不需要创建任何中间列表(与不同),因此可以有效地处理较大的值。 它还具有正确使用标点符号的好处-它将正确返回为短语的计数(而无参数的则不会)。它使用正则表达式标志,该标志在单词边界(aka和其他任何东西之间的转换)上匹配

  • 问题内容: 我有一个文件(更具体地说是一个log4j配置文件),我希望能够读取该文件并在代码中挑选出某些行并替换它们。例如,在文件中,有一串文本,指示文件的存储目录或记录器的级别。我希望能够替换这些文本字符串而无需读入文件,将其写入另一个文件以及删除原始文件。有没有一种使用Java来查找和替换文件中文本的更有效方法? 这是我尝试使用的文本文件的示例: 我希望能够读取文件并将’DEBUG’替换为另一

  • 给定两个文件会产生一个算法/程序来查找文件1中的单词,而不是文件2中的单词。请注意,文件中的单词不是按顺序排列的。 这是我的思考过程: 步骤1:读取文件2的单词并将其添加到哈希集 如果两个文件中的字数都只有100或1000个,那么这个算法就可以正常工作 但是,如果两个文件都很大(数十亿字),那么此解决方案将无法工作,因此我提出了一个改进的解决方案: 步骤1:逐字阅读文件2,并按字母顺序对单词进行排

  • 我正在构建一个应用程序,它将从用户那里提取一个单词,然后使用XPath扫描文件,根据文件中是否找到该单词返回true或false。 我已经构建了以下实现XPath的类,但我要么误解了它应该如何工作,要么我的代码有问题。有人能给我解释一下如何使用Xpath进行完整的文件搜索吗? 以及我目前正在测试的xml文件。 找到解决方案后,我丢失了找到的条目的正确显示,正如有人在注释“java”中指出的那样,我