Fork me on GitHub

JDK1.8 重识HashMap

摘要

JDK1.8相较于1.7对HashMap做了很大的优化,比如加入了新数据结构红黑树、Hash算法的优化和扩容的优化。

本篇结合这些区别,探索HashMap的结构实现和功能原理。

存储结构-字段

从数据结构来看,HashMap是数组+链表+红黑树实现的,如图所示:

 

HashMap中重要的几个属性(JDK 1.8):

1 static final int MAXIMUM_CAPACITY = 1 << 30;        // 所能容纳的Node极限数量
2 static final float DEFAULT_LOAD_FACTOR = 0.75f;     // 负载因子
3 static final int TREEIFY_THRESHOLD = 8;             // 当链表长度超过8时,将链表结构转为红黑树结构
4 static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // Node[] table的初始化长度length(默认值是16)

功能实现-方法

1.确定哈希桶数组索引位置

不管是增加、删除、查找键值对,定位到哈希桶数组的位置都是很关键的第一步。HashMap的数据结构是基于数组和链表(和红黑树),所以元素分布的越均匀,尽量使得每个位置上都只有一个元素(没有链表),那么我们用hash算法获取元素的时候,马上就可以得到,不需要遍历链表。HashMap定位索引位置,直接决定了hash方法的离散性能。下面看它是怎么做的:

static final int hash(Object key) {
        int h;
        // 第一步:h = key.hashCode() 取key的hashCode值
        // 第二步:h ^ (h >>> 16)      高位参与运算
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }
    对于任意给定的对象,key的hashCode()返回值是一定的不变的。
    为什么用这个算法?
        key.hashCode()函数调用的是key键值类型自带的哈希函数,返回int型散列值。

Java中'&'与、'|'或、'^'异或、'<<'左移位、'>>'右移位

2.分析HashMap的put方法

 1 public V put(K key, V value) {
 2     return putVal(hash(key), key, value, false, true);
 3 }
 4 static final int hash(Object key) {
 5     int h;
 6     return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
 7 }
 8 final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
 9                boolean evict) {
10     Node<K,V>[] tab; Node<K,V> p; int n, i;
11     // 判断数组table是否为空或为null,否则执行resize()进行扩容
12     if ((tab = table) == null || (n = tab.length) == 0)
13         n = (tab = resize()).length;
14     // 根据Key计算的hash值得到插入的数组索引i,如果tab[i]==null,直接新建节点,添加至数组上
15     if ((p = tab[i = (n - 1) & hash]) == null)
16         tab[i] = newNode(hash, key, value, null);
17     else {
18         Node<K,V> e; K k;
19         // 判断tab[i]的首个元素是否和要取的key一样,如果相同直接覆盖value
20         if (p.hash == hash &&
21             ((k = p.key) == key || (key != null && key.equals(k))))
22             e = p;
23         // 判断tab[i]是否为TreeNode,即是否为红黑树,如果是,在树中处理
24         else if (p instanceof TreeNode)
25             e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
26         // 否则,遍历tab[i]上的链表
27         else {
28             for (int binCount = 0; ; ++binCount) {
29                 // 如果链表的长度大于8,那么将链表转红黑树,在红黑树中执行插入操作
30                 if ((e = p.next) == null) {
31                     p.next = newNode(hash, key, value, null);
32                     if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
33                         treeifyBin(tab, hash);
34                     break;
35                 }
36                 // 如果发现链表中有相同的key(hash相同、key值也相同)
37                 if (e.hash == hash &&
38                     ((k = e.key) == key || (key != null && key.equals(k))))
39                     break;
40                 p = e;
41             }
42         }
43 
44         if (e != null) { // existing mapping for key
45             V oldValue = e.value;
46             if (!onlyIfAbsent || oldValue == null)
47                 e.value = value;
48             afterNodeAccess(e);
49             return oldValue;
50         }
51     }
52     // 超过最大容量,就进行扩容
53     ++modCount;
54     if (++size > threshold)
55         resize();
56     afterNodeInsertion(evict);
57     return null;
58 }

  ① 判断键值对数组table[i]是否为空或为null,否则执行resize()进行扩容;

  ② 根据键值key计算hash值得到插入的数组索引i,如果table[i]==null,直接新建节点添加,转向⑥,如果table[i]不为空,转向③;

  ③ 判断table[i]的首个元素是否和key一样,如果相同直接覆盖value,否则转向④,这里的相同指的是hashCode以及equals;

  ④ 判断table[i] 是否为treeNode,即table[i] 是否是红黑树,如果是红黑树,则直接在树中插入键值对,否则转向⑤;

  ⑤ 遍历table[i],判断链表长度是否大于8,大于8的话把链表转换为红黑树,在红黑树中执行插入操作,否则进行链表的插入操作;遍历过程中若发现key已经存在直接覆盖value即可;

  ⑥ 插入成功后,判断实际存在的键值对数量size是否超多了最大容量threshold,如果超过,进行扩容。

posted @ 2017-02-10 22:03  郑斌blog  阅读(895)  评论(0编辑  收藏  举报