在Python列表中查找最常见元素的有效方法是什么?
我的列表项可能无法散列,因此无法使用字典。同样在绘制时,应返回索引最低的项目。例:
>>> most_common(['duck', 'duck', 'goose'])
'duck'
>>> most_common(['goose', 'duck', 'duck', 'goose'])
'goose'
提出了这么多解决方案,令我惊讶的是没有人提出我认为很明显的解决方案(对于不可哈希但可比较的元素)-[ itertools.groupby
] [1]。
itertools
提供快速,可重用的功能,并允许您将一些棘手的逻辑委托给经过良好测试的标准库组件。考虑例如:
import itertools
import operator
def most_common(L):
# get an iterable of (item, iterable) pairs
SL = sorted((x, i) for i, x in enumerate(L))
# print 'SL:', SL
groups = itertools.groupby(SL, key=operator.itemgetter(0))
# auxiliary function to get "quality" for an item
def _auxfun(g):
item, iterable = g
count = 0
min_index = len(L)
for _, where in iterable:
count += 1
min_index = min(min_index, where)
# print 'item %r, count %r, minind %r' % (item, count, min_index)
return count, -min_index
# pick the highest-count/earliest item
return max(groups, key=_auxfun)[0]
当然,这可以写得更简洁一些,但我的目标是最大程度地清晰。print
可以不加注释这两个语句,以更好地了解运行中的机制。例如, 带有未 注释的打印:
print most_common(['goose', 'duck', 'duck', 'goose'])
发出:
SL: [('duck', 1), ('duck', 2), ('goose', 0), ('goose', 3)]
item 'duck', count 2, minind 1
item 'goose', count 2, minind 0
goose
如您所见,SL
是一个成对的列表,每对一个项目,后跟原始列表中的项目索引(以实现关键条件,即,如果具有相同最高计数的“最常见”项目>
1,则结果必须是最早出现的一个)。
groupby
仅按项目分组(通过operator.itemgetter
)。辅助功能在max
计算过程中每分组一次调用,它接收并在内部解压缩一个组-
具有两个项目的元组,(item, iterable)
其中可迭代项也是两个项目元组(item, original index)
[[
SL
]的项目]。
然后,辅助功能使用循环来确定组可迭代项中的条目数 和
最小原始索引。它返回那些作为组合的“质量关键字”,并且最小索引符号已更改,因此该max
操作将考虑“更好”那些在原始列表中较早出现的项目。
此代码可能是更简单的,如果它担心一 点点 时间和空间,少谈大O问题,如…:
def most_common(L):
groups = itertools.groupby(sorted(L))
def _auxfun((item, iterable)):
return len(list(iterable)), -L.index(item)
return max(groups, key=_auxfun)[0]
相同的基本思想,只是表达得更简单,紧凑…但是,可惜的是,额外的O(N)辅助空间(将组的可迭代对象体现到列表中)和O(N平方)时间(获取L.index
每个项目的总和)
。尽管过早的优化是编程中所有弊端的根源,但在O(N log N)可用时刻意选择O(N平方)方法与可扩展性背道而驰!
最后,对于那些更喜欢“单线”而不是清晰度和性能的人,可以使用名称经过适当修饰的1线附加版本:-)。
from itertools import groupby as g
def most_common_oneliner(L):
return max(g(sorted(L)), key=lambda(x, v):(len(list(v)),-L.index(x)))[0]
问题内容: 我明白 将导出列表中最常见的元素 但是如何在不使用辅助函数的情况下导出列表列表中最常见的元素? 例如 输出应等于。 当我尝试 它写道 谁能帮帮我吗? 问题答案: 有很多方法,但是我想让您知道,标准模块中有一些用于这类事情的好工具,例如: 或者,您可以(有点)将当前解决方案用于每个子列表:
问题内容: 在Python列表中查找最常见元素的有效方法是什么? 我的列表项可能无法散列,因此无法使用字典。同样在绘制的情况下,应返回索引最低的项目。例: 问题答案: 提出了这么多解决方案,令我惊讶的是没有人提出我认为显而易见的解决方案(对于不可哈希但可比较的元素)-。 提供快速,可重用的功能,并允许你将一些棘手的逻辑委托给经过良好测试的标准库组件。考虑例如: 当然,这可以写得更简洁一些,但我的目
问题内容: 这个问题已经在这里有了答案 : 在列表中找到出现次数最多的项目 (13个答案) 4个月前关闭。 给出以下列表 我正在尝试计算每个单词出现多少次并显示前3位。 但是,我只想查找首字母大写的前三位,而忽略不首字母大写的所有单词。 我敢肯定有比这更好的方法,但是我的想法是做以下事情: 将列表中的第一个单词放入另一个称为uniquewords的列表中 从原始列表中删除第一个单词及其所有重复单词
本文向大家介绍在Python的2D列表中查找最常见的元素,包括了在Python的2D列表中查找最常见的元素的使用技巧和注意事项,需要的朋友参考一下 2D列表具有列表作为其元素。换句话说,它是一个列表列表。在本文中,我们需要找到列表中所有列表中最常见的元素。 随着最大和计数 我们设计一个条件为in的跟随项,以检查给定子列表中元素的存在。然后,我们将max函数与count函数一起使用以获取具有最大频率
本文向大家介绍在Python列表中查找最常使用的元素,包括了在Python列表中查找最常使用的元素的使用技巧和注意事项,需要的朋友参考一下 在本文中,我们将看到如何查找给定列表中最常见的元素。换句话说,频率最高的元素。 随着最大和计数 我们应用了为什么set函数获取列表的唯一元素,然后考虑列表中的每个元素。最后应用max函数获得频率最高的元素。 示例 输出结果 运行上面的代码给我们以下结果- 带柜
问题内容: 为了找到最普通的东西,我知道我可以这样使用: 但是,我似乎找不到任何可比的东西,以找到最不常见的元素。 请给我有关如何做的建议。 问题答案: 借用并适当地反转: