存储:put 方法 put(key,value)
查询 : get 方法 get(key)
java 代码如下
import java.util.HashMap;
import java.util.Map;
public class App {
public static void main(String[] args) {
Map<String,String> map = new HashMap<>();
map.put("刘一","刘一");
map.put("陈二","陈二");
map.put("张三","张三");
map.put("李四","李四");
map.put("王五","王五");
map.put("Money","我是猴哥Money老师");
System.out.println(map.get("Money"));
}
}
//输出结果:我是猴哥Money老师
1234567891011121314151617
程序是等于我们的数据结构和算法
HashMap 其实就是做存储的,做存储的就是数据结构
存储是按上面的规则存储的,那查询是怎么查的了
//数组:采用一段连续的存储单元来存储数据的
//数组的特点: 查询时间复杂度:0(1) ,删除,插入,时间负责度0(N),总结:查询块,插入慢
public static void main(String [] args){
//数组的定义:初始化长度为10,数据类型Integer ,
Integer integer[] = new Integer[10];
//指定下标,复制
integer[0]=0;
//指定下标,复制
integer[1]=1;
//指定下标,复制
integer[9]=2;
//指定下标,复制
integer[9]=400;
System.out.println(integer[9]);
}
// 输出结果:400
12345678910111213141516
数组结构如图:
查询: 时间复杂度 0(1),查询非常快的
删除,插入 :时间复杂度0(N) 非常慢的,效率没有查询那么快
为什么查询快,插入,删除慢了?
查询快
插入,删除慢
扩充:
大家知道我们java 哪一个类,底层用的就是数组?
在我们的java.util 包下面有一个ArrayList 类,如图
怎么验证了?
我们查看它的add 方法
public boolean add(E var1) {
this.ensureCapacityInternal(this.size + 1);
this.elementData[this.size++] = var1;
return true;
}
12345
如果面试被问到ArrayList 的特性,直接回答 查询快,插入,删除慢
谈谈什么是链表?
在java 中是这么定义的:
package node;
import com.sun.org.apache.bcel.internal.generic.IMPDEP1;
public class Node {
public Node next;
private Object data;
public Node(Object next) {
this.data = next;
}
//链表:链表是一种物理存储单元上非连续,非顺序的存储结构
//特点: 插入,删除时间复杂度0(1) 查找遍历时间复杂度0(N) 总结:插入快,查询慢
public static void main(String[] args){
Node head =new Node("monkey");
head.next =new Node("张三");
head.next.next =new Node("刘一");
System.out.println(head.data);
System.out.println(head.next.data);
System.out.println(head.next.next.data);
}
}
//输出结果:
//monkey
//张三
//刘一
1234567891011121314151617181920212223242526272829
链表:链表是一种物理存储单元上非连续,非顺序的存储结构,如图:
为什么它插入,删除快,查询慢了?
删除 某个节点,只需要上一个节点 head.next =null
插入 某个几点,只需要上一个节点 head.next 指向插入的节点,插入的节点指向下一个节点
查询某个节点:链表查询都要通过头节点,比如我们要查‘刘一’,我们则要先查头monkey,再查张三,再查到刘一,
虽然只有3个节点,但是我们要查到刘一要查三次,把整个链表都遍历了一次,所以查询慢!
扩充
在我们java 中,哪一个util 类采用的链表来实现的?
我们来查看它的add 方法
public boolean add(E var1) {
this.linkLast(var1);
return true;
}
//看上面有一个linkLast,如下:
void linkLast(E var1) {
LinkedList.Node var2 = this.last;
LinkedList.Node var3 = new LinkedList.Node(var2, var1, (LinkedList.Node)null);
this.last = var3;
if (var2 == null) {
this.first = var3;
} else {
var2.next = var3;
}
++this.size;
++this.modCount;
}
//看上面有一个Node,如下:
private static class Node<E> {
E item;
LinkedList.Node<E> next;
LinkedList.Node<E> prev;
Node(LinkedList.Node<E> var1, E var2, LinkedList.Node<E> var3) {
this.item = var2;
this.next = var3;
this.prev = var1;
}
}
//上面有一个next,有一个prev
//这是一个双向链表
123456789101112131415161718192021222324252627282930313233
双向链表如图: 类似与分页,上一页,下一页,下面的对象也可以获取上面对象的数据(head.prev)
现在大家都已经了解JDK7 HashMap 数据结构了,开始了解下算法!
那么HashMap 是怎么去存储的了?他是如何将数据放到我们的数组和链表上的?
用的就是哈希算法,你们知道哈希算法的底层是怎么实现的?
哈希表
什么是哈希算法?
哈希算法(也叫散列),就是把任意长度值(key)通过散列算法变换成固定长度的key(地址), 通过这个地址进行访问的数据结构,
它通过把关键码值映射到表中一个位置来访问记录,以加快查找速度。
例如图中的John Smith 通过散列算法变换成固定长度的key:152 (永远是152),然后通过152 变成John Smith 是不可能的,哈希算法是不可逆的。
HashCode: 通过字符串算出它的ascii 码,进行mod(取模),算出哈希表中的下标
代码如下:
public class AsciiCode {
public static void main(String[] args) {
char c [] ="lies".toCharArray();
for (int i = 0; i < c.length; i++) {
System.out.println((c[i])+":" +(int)c[i]);
}
}
}
//输出结果:
//l:108
//i:105
//e:101
//s:115
123456789101112131415
如果我们取模会出现什么问题
会出现
hash
冲突(碰撞)的一个问题,
什么是hash冲突
Hash冲突怎么解决了
我们用链表来解决这个问题, 链表是有一个指针的,我们可以让这个lies 指向这个foes,我们让foes 去匹配下标为9 的这个节点,如果匹配lies 不相等,则去匹配下一个节点foes,最终就会找到这个foes,这就是我们hash 算法底层的原理及解决冲突。
public class App {
public static void main(String[] args) {
//Map<String,String> map = new HashMap<>();
App map = new App();
map.put("刘一","刘一");
map.put("陈二","陈二");
map.put("张三","张三");
map.put("李四","李四");
map.put("王五","王五");
map.put("Money","我是猴哥Money老师");
//System.out.println(map.get("Money"));
}
public void put(String key,String value){
System.out.printf("key:%s:::::::::::::::;::hash值:%s:::::::::::::::::::存储位置:%s\r\n",key,key.hashCode(),Math.abs(key.hashCode() % 15));
}
}
//输出结果:
// key:刘一:::::::::::::::;::hash值:671464:::::::::::::::::::存储位置:4
// key:陈二:::::::::::::::;::hash值:1212740:::::::::::::::::::存储位置:5
// key:张三:::::::::::::::;::hash值:774889:::::::::::::::::::存储位置:4
// key:李四:::::::::::::::;::hash值:842061:::::::::::::::::::存储位置:6
// key:王五:::::::::::::::;::hash值:937065:::::::::::::::::::存储位置:0
// key:Monkey:::::::::::::::;::hash值:-1984628749:::::::::::::::::::存储位置:4
123456789101112131415161718192021222324252627
模拟我们是怎么存值的
我们一组数据就是 key,value , 可以用string,int 来存吗?这里显然不能,我们一般存这种值一般用对象来存值,我在这里随便命名用个Object或者叫Entry 对象,其实我们还要存另外两个值?(hash和next),当发生hash 冲突的时候(存储位置4) next 可以指向下一个节点,hash 值是用来比较的,比较hashCode 值是否相等!
上面的图形结构,我们就知道如何存数据了!
那我们该如何取数据了?
-假如我们要取‘刘一’ 的值
模拟java HashMap
定义一个Map 接口
/**
* 自己手动定义Map
* @param <K>
* @param <V>
*/
public interface Map<K,V> {
V put(K k,V v);
V get(K k);
int size();
interface Entry<K,V>{
K getKey();
V getValue();
}
}
12345678910111213141516171819
定义一个实现Map 的HashMap
import sun.management.snmp.jvmmib.JvmRTInputArgsTableMeta;
/**
* 自己定义HashMap
* @param <K>
* @param <V>
*/
public class HashMap<K,V> implements Map<K,V>{
//存储元素对象
private Entry<K,V> table[] = null;
//扩容初始化
int size =0;
//初始化存储元素对象大小
public HashMap() {
this.table = new Entry[16];
}
/**
* 1.通过key hash 算法算出hash值,然后取模
* 2.取模后就有对应的index 数组下标,然后存储对象<Entry>
* 3.判断当前对象是否为空,如果空,直接存储,
* 4.如果不为空,我们就要用到next 链表
* 5.返回当前这个节点
* @param k
* @param v
* @return
*/
@Override
public V put(K k, V v) {
int index = hash(k);
Entry<K,V> entry = table[index];
if(null ==entry){
//刘一,陈二,李四,王五 就开始存在这个entry,每个entry 对象则存储到了对应table 中
table[index] = new Entry<>(k, v, index, null);
size++;
}else{
//冲突了,张三,Monkey
table[index] = new Entry<>(k, v, index, entry);
}
return table[index].getValue();
}
private int hash(K k) {
//HashMap 底层用到的是移位的操作,性能高很多 >>,我们这里就直接取模
int index =k.hashCode() % 16;
//Math.abs(index);
return index>0?index:-index;
}
/**
* 1.通过 key 进行hash 运算,取模,找到数组对应的下标 index
* 2.判断当前对象是否为空,如果不为空
* 3.判断是否相等,如果不相等
* 4.判断next 是否为空,如果不为空,
* 5.再判断相等,知道相等为止,或者为空为止
* 6.然后返回
*
*
*
* @param k
* @return
*/
@Override
public V get(K k) {
//如果没有存储数据那size 为0,也不用查了,直接返回null
if(size ==0){
return null;
}
int index = hash(k);
Entry<K, V> entry = findValue(table[index], k);
//通过index 找打这个对象
return entry==null?null:entry.getValue();
}
/**
*
* @param entry
* @param k 查询刘一
* @return
*/
private Entry<K,V> findValue(Entry<K,V> entry,K k) {
//存的可能是数值类型,也可能是字符串类型
if (k.equals(entry.getKey()) || k == entry.getKey()) {
return entry;
//如果不相等,估计这个节点是个链表,判断它next 数据是否匹配
} else {
if(entry.next !=null){
//用到递归,在链表里面一直查询这个k,值是否相等
return findValue(entry.next,k);
}
}
return null;
}
@Override
public int size() {
return size++;
}
class Entry<K,V> implements Map.Entry<K,V>{
//存四个值
K k;
V v;
int hash;
Entry<K,V> next;
public Entry(K k, V v, int hash, Entry<K, V> next) {
this.k = k;
this.v = v;
this.hash = hash;
this.next = next;
}
@Override
public K getKey() {
return k;
}
@Override
public V getValue() {
return v;
}
}
}
123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132
定义一个测试类
public class Test {
public static void main(String[] args) {
Map<String,String> map = new HashMap<>();
map.put("Monkey","我是moneky老师");
map.put("东山再起","东山再起是位好同学");
System.out.println(map.get("Monkey"));
System.out.println(map.get("东山再起"));
}
//输出结果:
//我是moneky老师
//东山再起是位好同学
}
1234567891011121314
查看到测试结果,我们就能看到HashMap ,是怎么存储的,和获取值的!
但是JDK8 用的是红黑树,为什么了?
举个代码的例子
import com.sun.xml.internal.ws.api.model.wsdl.WSDLOutput;
public class Test {
public static void main(String[] args) {
Map<String,String> map = new HashMap<>();
for (int i = 0; i < 1000; i++) {
map.put("Monkey"+i,"我是moneky老师"+i);
}
System.out.println(map);
}
}
123456789101112
可以看到这个map 的size 只有16,却存了很多的数据:
容量不够,我们就只能把这个数据放到链表上,链表无线延长,这种hash冲突是十分严重的,而链表的特性是查询慢,而链表又无线延长,我们查询链表末端的数据,这样性能就很低了,
总结:解决链表过长查询效率过低的问题
前提条件
阈值 8
HashMap 类下面有个这个:
static final int TREEIFY_THRESHOLD = 8;
1
为什么要阈值 是8 了?
因为红黑叔插入慢,他要判断小中大(也就是左边的小于右边的),而链表插入快,删除快,但是为什么是 8 不是 6了?
我要去百度一下,有哪位大佬知道可以跟我讲下?