当前位置: 首页 > 编程笔记 >

java 中HashCode重复的可能性

百里修真
2023-03-14
本文向大家介绍java 中HashCode重复的可能性,包括了java 中HashCode重复的可能性的使用技巧和注意事项,需要的朋友参考一下

java 中HashCode重复的可能性

今天有同事提议用String的hashcode得到int类型作为主键。其实hashcode重复的可能性超大,下面是java的缺省算法:  

public int hashCode() { 
  int h = hash; 
  if (h == 0) { 
    int off = offset; 
    char val[] = value; 
    int len = count; 
 
      for (int i = 0; i < len; i++) { 
        h = 31*h + val[off++]; 
      } 
      hash = h; 
    } 
    return h; 
  }

但是什么情况下会重复?下面是测试代码

import java.util.HashMap; 
 
public class Test { 
 
  static HashMap map = new HashMap(); 
 
  private static char startChar = 'A'; 
 
  private static char endChar = 'z'; 
 
  private static int offset = endChar - startChar + 1; 
 
  private static int dup = 0; 
 
  public static void main(String[] args) { 
    int len = 3; 
    char[] chars = new char[len]; 
    tryBit(chars, len); 
    System.out.println((int)Math.pow(offset, len) + ":" + dup); 
  } 
 
  private static void tryBit(char[] chars, int i) { 
    for (char j = startChar; j <= endChar; j++) { 
      chars[i - 1] = j; 
      if (i > 1) 
        tryBit(chars, i - 1); 
      else 
        test(chars); 
    } 
  } 
 
  private static void test(char[] chars) { 
 
    String str = new String(chars).replaceAll("[^a-zA-Z_]", "").toUpperCase();// 195112:0 
    //String str = new String(chars).toLowerCase();//195112:6612 
    //String str = new String(chars).replaceAll("[^a-zA-Z_]","");//195112:122500 
    //String str = new String(chars);//195112:138510 
    int hash = str.hashCode(); 
    if (map.containsKey(hash)) { 
      String s = (String) map.get(hash); 
      if (!s.equals(str)) { 
        dup++; 
        System.out.println(s + ":" + str); 
      } 
    } else { 
      map.put(hash, str); 
      // System.out.println(str); 
    } 
  } 
} 

在A-z范围内有特殊字符,从结果看,仅仅3位长度的字符串:

不处理: 138510次重复

去掉字母意外字符: 122500次重复

所有字符转小写:6612次重复(少了很多)

去掉字母意外字符,并且转小写:没有重复!4位字符串也没见重复

不难看出:

1. 缺省实现为英文字母优化
2. 字母大小写可能导致重复

可能:

长字符串可能hashcode重复
中文字符串和特殊字符可能hashcode重复

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持,如有疑问请留言或者到本站社区交流讨论,大家共同进步!

 类似资料:
  • 我需要一些帮助,从理论上更好地理解方法。我读过(强调我的): 当对两个单独的对象调用时(根据方法,这两个对象是相等的),它将返回相同的哈希代码值。但是,如果在两个不相等的对象上调用它,它不一定会返回不同的整数值。 上述例外情况会发生在哪里?

  • 问题内容: 我读了一本书,其中显示了一个内存区域,该区域有助于(例如)在内存中找到合适的对象。但是,如果我们不能直接用Java操作内存,那怎么可能呢?没有指针,除了它,还创建了对象并将其从一个地方移动到另一个地方,而开发人员对此一无所知。 我读到这样的实现是可怕而可怕的,但是如果我们不能指示VM将对象放在哪里,有什么区别呢? 问题是:如果我们无法操纵内存,那么在深层次上的目的是什么? 问题答案:

  • 我想混淆(*)一些密码,以便将它们隐藏在Java源代码中。 发现jasypt,我想我事先加密了密码文本,然后在源代码中从记住的种子+加密密码中解密。但是,加密过程似乎不是可复制的:当使用 每次运行时,我都会返回不同的加密密码:、或。 我如何使加密可复制,这样我就可以使用种子加加密字符串来生成真正的密码? (*)我使用“混淆”,因为我知道这根本不是一种隐藏密码的安全方法,但至少它可以帮助人们在将密码

  • 我试图在Textpad中复制这个Java程序,但我收到以下错误 C:\Users\User\Desktop\java\Drawing.java:14: 错误: 不兼容的类型: 从 float 到 int g.drawLine ((getWidth()/2) , 0, (getWidth()*i) , (getHeight()/2)); 这是代码 在getWidth*i之前我已经尝试过添加(floa

  • 我有一个“从int到byte的可能有损转换”错误的问题,但我没有在代码中将整数转换为byte。 这是笔记本课 我不知道为什么我会得到这个错误。有人能帮助我吗?谢谢你。