快速提问主要满足我对这个话题的好奇心。
我正在编写一些带有SQlite数据库后端的大型python程序,并且将来会处理大量记录,因此,我需要尽可能地优化。
对于一些功能,我正在字典中搜索关键字。我一直在使用“ in”关键字进行原型设计,并计划稍后返回并优化这些搜索,因为我知道“
in”关键字通常为O(n)(因为这仅表示python遍历整个列表并进行比较每个元素)。但是,由于python
dict基本上只是一个哈希映射,因此python解释器足够聪明来解释:
if(key in dict.keys()):
...code...
至:
if(dict[key] != None):
...code...
它基本上是相同的操作,但顶部为O(n),底部为O(1)。
对我来说,在代码中使用底部版本很容易,但是后来我很好奇并以为我会问。
首先,key in d.keys()
保证为您提供与key in d
dict相同的值d
。
而且,in
对dict
或操作(从3.x中dict_keys
调用)返回的对象的操作 不是 O(N),而是O(1)。keys()
__
没有真正的“优化”。只是使用哈希是在__contains__
哈希表上实现的明显方法,就像它是实现的明显方法一样__getitem__
。
您可能会问这在哪里得到保证。
好吧,不是。映射类型将dict
基本上定义为的哈希表实现collections.abc.Mapping
。没有什么可以阻止某人创建Mapping的哈希表实现的,但是仍然可以提供O(N)搜索。但是,要实现如此糟糕的实现将是额外的工作,那么为什么要这么做呢?
如果您确实需要自己证明它,则可以测试您关心的每个实现(使用探查器,或者通过将某种类型与自定义一起使用,__hash__
并__eq__
记录调用,或者…),或者阅读源代码。
在2.x中,您不想调用keys
,因为它会生成一个list
密钥,而不是一个KeysView
。您可以使用iterkeys
,但可能会生成迭代器或其他不是O(1)的东西。因此,只需将dict本身用作序列即可。
即使在3.x中,也不需要调用keys
,因为没有必要。迭代a dict
,检查其__contains__
,并且通常将其视为序列 总是
等同于对其键执行相同的操作,那么为什么要打扰呢?(当然,构建琐碎的宏KeyView
并进行访问将使您的运行时间增加几纳秒,并为程序增加一些击键。)
(尚不清楚d.keys()
/d.iterkeys()
和d
2.x中使用序列运算是否等效。除了性能问题外,它们在每个CPython,Jython,IronPython和PyPy实现中
均 等效,但是似乎在任何地方都没有说明。 3.x中的方式。这并不重要;只需使用key in d
。)
在进行此操作时,请注意以下几点:
if(dict[key] != None):
……将无法正常工作。如果key
不在中dict
,则将引发KeyError
而不返回None
。
另外,您永远不要None
使用==
或进行检查!=
。经常使用is
。
您可以使用try
-或更简单地说,执行do if dict.get(key, None) is not None
。但是同样,没有理由这样做。此外,这将无法处理None
完全有效的物品。在这种情况下,您需要执行sentinel = object(); if dict.get(key, sentinel) is not sentinel:
。
因此,正确的写法是:
if key in d:
更普遍地说,这是不正确的:
我知道关键字“ in”通常为O(n)(因为这仅表示python遍历整个列表并比较每个元素
in
与大多数其他运算符一样,该运算符仅是对__contains__
方法的调用(或等效于内置的C / Java / .NET /
RPython)。list
通过迭代列表并比较每个元素来实现它;dict
通过散列值并查找散列来实现它;blist.blist
通过走B +
Tree来实现它;因此,它可以是O(n),O(1),O(log n)或完全不同的东西。
问题内容: 我有以下列表,其中包含重复的具有不同值的汽车注册号。我想将其转换为字典,该字典接受汽车登记号的多个键。 到目前为止,当我尝试将列表转换为字典时,它消除了键之一。如何制作具有重复键的字典? 清单是: 我试过的代码是: 问题答案: Python字典不支持重复键。一种解决方法是将列表或集合存储在字典中。 一种简单的方法是使用: 你要做的就是更换 与 你将获得一个列表字典。
问题内容: 码: 打印。我不确定该方法如何确定l中关键字的顺序。但是,我希望能够以“适当”的顺序检索关键字。当然,正确的顺序将创建列表。 和这个: 问题答案: 你可以使用OrderedDict(需要Python 2.7)或更高版本。 另外,请注意,由于dict你使用进行创建的操作已经忘记了元素的顺序,因此该操作无效。相反,你想使用。 如文档中所述,对于低于python 2.7的版本,你可以使用此配
问题内容: 我正在寻找一个有序的关联数组,即有序的字典的可靠实现。我想要按键而不是插入顺序排序。 更准确地说,我正在寻找一种int-to-float(或另一种用例是string-to-float)映射结构的节省空间的实现,该结构的结构是: 有序迭代为O(n) 随机访问为O(1) 我想到的最好的方法是将字典和键列表粘合在一起,使最后一个键按等分和插入顺序排列。 还有更好的主意吗? 问题答案: “随机
问题内容: 我有以下字典 我想获取字典列表中每个字典值“ KA20”和“ KA23”的键“ tmst”的总和。 您能对此提出建议吗? 问题答案: 您可以使用: 请注意,要正常工作,必须按分组键进行排序:
问题内容: 有没有一种方法可以重命名字典键,而无需将其值重新分配给新名称并删除旧名称键;而且没有迭代字典键/值? 对于OrderedDict,在保持键的位置的同时执行相同的操作。 问题答案: 对于常规命令,可以使用: 对于OrderedDict,我认为你必须使用一种理解来构建一个全新的。 正如这个问题似乎提出的那样,修改密钥本身是不切实际的,因为dict密钥通常是不可变的对象,例如数字,字符串或元
本文向大家介绍浅谈python字典多键值及重复键值的使用,包括了浅谈python字典多键值及重复键值的使用的使用技巧和注意事项,需要的朋友参考一下 在python中使用字典,格式如下: dict={ key1:value1 , key2;value2 ...} 在实际访问字典值时的使用格式如下: dict[key] 多键值 字典的多键值形式如下: dict={(ke11,key12):value