问题：

HashMap中的哈希方法[重复]

松雅昶

2023-03-14

可能重复：
HashMap#hash（int）方法的解释

   /**
    * Applies a supplemental hash function to a given hashCode, which
    * defends against poor quality hash functions.  This is critical
    * because HashMap uses power-of-two length hash tables, that
    * otherwise encounter collisions for hashCodes that do not differ
    * in lower bits. Note: Null keys always map to hash 0, thus index 0.
    */
   static int hash(int h) {
       // This function ensures that hashCodes that differ only by
       // constant multiples at each bit position have a bounded
       // number of collisions (approximately 8 at default load factor).
       h ^= (h >>> 20) ^ (h >>> 12);
       return h ^ (h >>> 7) ^ (h >>> 4);
   }

有人能详细解释一下这个方法吗，谢谢。

共有2个答案

宋建柏

2023-03-14

很好，不涉及细节，但：

由于hascode（）和equals（）契约，hashcode函数的糟糕实现可能会导致不同实例具有相同的hashcode。这意味着您可能有一个具有蹩脚hashcode（）方法实现的类，这样该类的equals（）方法将为a和B实例返回false（这意味着它们不同于业务逻辑的观点），但hashcode（）方法为实例a和B返回相同的值。同样，根据hashcode（）和equals（）约定，这在技术上是有效的，但不太合适

在类似哈希表的结构（如HashMap）中，“bucket”用于根据其哈希代码将实例放置在映射内。如果两个实例具有相同的hashcode（）（但根据equals（）方法不同），则它们都将放在同一个bucket中。从性能的角度来看，这是不好的，因为当您有很多这样的情况时，您会失去一些类似哈希表的结构固有的检索速度。这些被称为碰撞。所发生的是，如果稍后有人使用“搜索”实例从hashmap中检索某些内容，并且相应的哈希桶有多个占用者，则必须使用equals（）方法检查该桶中的每个元素，以找出需要检索的元素。在极端情况下，可以将HashMap转换为这样的链表。

该hash（int n）方法向现有hashcode（）值添加了一些额外的东西，以防止出现此类情况。

端木兴国

2023-03-14

设计通用哈希代码的一个问题是，您将所有这些努力都放在确保良好的位分布上，然后有人出现并以完全撤销的方式使用它。

让我们举一个典型的例子，一个坐标类有一个X和一个Y，都是整数。

这是一个经典的例子，因为人们会用它来证明X^Y不是一个好的哈希码，因为通常有几个对象X==Y（所有哈希为0）或一个其X和Y是另一个的Y和X（将哈希相同）以及我们最终得到相同哈希码的其他情况。

归根结底，尽管整数有一个覆盖40亿值的可能范围，但在99%的使用中，它们往往小于几百或几万。我们永远无法摆脱在可能的结果中传播1.8京可能的值40亿，但我们可以努力使那些我们可能实际看到的值不太可能发生冲突。

现在，<代码>（X

不幸的是，如果使用此哈希是为了索引到表中（或者甚至在较小的程度上索引到其他数字），那么对于X以下的值，我们可以认为是最常见的X，此哈希将有效地返回Y。

我们所有的努力都白费了！

所使用的重新哈希是用这样的逻辑生成一个哈希，稍微好一点。

值得注意的是，对（X）过于挑剔是不公平的

类似资料：

Java HashMap密钥哈希[重复]

如果我在hashmap中输入一个键和值，并且基于键hashcode生成的索引大于15，并且映射大小仍然小于阈值（即12），会发生什么？提前谢谢。
HashMap中NULL键的哈希码

问题内容：我只是在阅读有关Java中HashMap和HashTable类之间的区别。在那里，我发现了一个区别，即前者允许空键，而后者则没有特权。就HashMap的工作而言，我知道，它在键上调用hashcode方法，以查找要在其中放置该键值对的存储桶。我的问题来了：如何计算空值的哈希码？或者空键的哈希码是否有任何默认值（如果需要，请指定该值）？问题答案：从HashMap：如果进一步看，您会发
为什么HashMap重新哈希键对象提供的哈希码？

问题内容：我正在阅读Java 1.6 API提供的HashMap类的代码，无法完全理解以下操作的需要（位于put和get方法的主体中）：该方法具有以下主体：通过对提供的哈希码执行位操作，可以有效地重新计算哈希。即使API声明如下，我也无法理解这样做的必要性：这很关键，因为HashMap使用2的幂的哈希表，否则哈希表在低位无差异时会遇到冲突。我确实知道键值参数存储在数据结构数组中，并且该数
HashMap中键的"规范化"哈希

HashMap将其数据保存在存储桶中，如下所示：要在HashMap中放置一些东西，我们需要一个hash（）函数，它返回从0到table.length（）范围内的关键哈希，对吗？假设我有：这将返回以下内容：字符串本机哈希代码：46882035，哈希映射哈希：46882360 我们应该有大约256个桶（所以关键的散列应该在0到256的范围内），但是HashMap中的内部散列给了我们468823
哈希表或哈希表中的重新哈希处理

问题内容：当大小超过maxthreshold值时，如何在哈希表或哈希表中进行重新哈希处理？是否所有对都已复制到新的存储桶阵列中？编辑：重新哈希后，同一存储桶（位于链接列表中）中的元素会发生什么情况？我的意思是说，他们在重新哈希处理后会留在同一个桶中吗？问题答案：问题中的最大阈值称为负载系数。建议负载系数约为0.75。负载因子定义为（m / n），其中n是哈希表的总大小，m是在需要增加
HashMap重新哈希/调整大小容量

问题内容： A 在其文档中有这样的短语：如果初始容量大于最大条目数除以负载因子，则将不会发生任何哈希操作。请注意文档中说的是 rehash ，而不是 resize- 即使仅在调整大小时才会发生rehash；也就是说，当存储桶的内部尺寸变大两倍时。当然提供了这样的构造函数，我们可以在其中定义此初始容量。构造一个具有指定初始容量和默认负载因子（0.75）的空HashMap。 OK，看起

HashMap中的哈希方法[重复]

共有2个答案

相关问答

相关文章

相关阅读

相关工具

相关文档