JDK1.8 重识HashMap

摘要

JDK1.8相较于1.7对HashMap做了很大的优化，比如加入了新数据结构红黑树、Hash算法的优化和扩容的优化。

本篇结合这些区别，探索HashMap的结构实现和功能原理。

存储结构-字段

从数据结构来看，HashMap是数组+链表+红黑树实现的，如图所示：

HashMap中重要的几个属性（JDK 1.8）：

1 static final int MAXIMUM_CAPACITY = 1 << 30;        // 所能容纳的Node极限数量
2 static final float DEFAULT_LOAD_FACTOR = 0.75f;     // 负载因子
3 static final int TREEIFY_THRESHOLD = 8;             // 当链表长度超过8时，将链表结构转为红黑树结构
4 static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // Node[] table的初始化长度length（默认值是16）

功能实现-方法

1.确定哈希桶数组索引位置

不管是增加、删除、查找键值对，定位到哈希桶数组的位置都是很关键的第一步。HashMap的数据结构是基于数组和链表（和红黑树），所以元素分布的越均匀，尽量使得每个位置上都只有一个元素（没有链表），那么我们用hash算法获取元素的时候，马上就可以得到，不需要遍历链表。HashMap定位索引位置，直接决定了hash方法的离散性能。下面看它是怎么做的：

static final int hash(Object key) {
        int h;
        // 第一步：h = key.hashCode() 取key的hashCode值
        // 第二步：h ^ (h >>> 16)      高位参与运算
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }
    对于任意给定的对象，key的hashCode()返回值是一定的不变的。
    为什么用这个算法？
        key.hashCode()函数调用的是key键值类型自带的哈希函数，返回int型散列值。

Java中'&'与、'|'或、'^'异或、'<<'左移位、'>>'右移位

2.分析HashMap的put方法

 1 public V put(K key, V value) {
 2     return putVal(hash(key), key, value, false, true);
 3 }
 4 static final int hash(Object key) {
 5     int h;
 6     return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
 7 }
 8 final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
 9                boolean evict) {
10     Node<K,V>[] tab; Node<K,V> p; int n, i;
11     // 判断数组table是否为空或为null，否则执行resize()进行扩容
12     if ((tab = table) == null || (n = tab.length) == 0)
13         n = (tab = resize()).length;
14     // 根据Key计算的hash值得到插入的数组索引i，如果tab[i]==null，直接新建节点，添加至数组上
15     if ((p = tab[i = (n - 1) & hash]) == null)
16         tab[i] = newNode(hash, key, value, null);
17     else {
18         Node<K,V> e; K k;
19         // 判断tab[i]的首个元素是否和要取的key一样，如果相同直接覆盖value
20         if (p.hash == hash &&
21             ((k = p.key) == key || (key != null && key.equals(k))))
22             e = p;
23         // 判断tab[i]是否为TreeNode，即是否为红黑树，如果是，在树中处理
24         else if (p instanceof TreeNode)
25             e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
26         // 否则，遍历tab[i]上的链表
27         else {
28             for (int binCount = 0; ; ++binCount) {
29                 // 如果链表的长度大于8，那么将链表转红黑树，在红黑树中执行插入操作
30                 if ((e = p.next) == null) {
31                     p.next = newNode(hash, key, value, null);
32                     if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
33                         treeifyBin(tab, hash);
34                     break;
35                 }
36                 // 如果发现链表中有相同的key（hash相同、key值也相同）
37                 if (e.hash == hash &&
38                     ((k = e.key) == key || (key != null && key.equals(k))))
39                     break;
40                 p = e;
41             }
42         }
43 
44         if (e != null) { // existing mapping for key
45             V oldValue = e.value;
46             if (!onlyIfAbsent || oldValue == null)
47                 e.value = value;
48             afterNodeAccess(e);
49             return oldValue;
50         }
51     }
52     // 超过最大容量，就进行扩容
53     ++modCount;
54     if (++size > threshold)
55         resize();
56     afterNodeInsertion(evict);
57     return null;
58 }

　　① 判断键值对数组table[i]是否为空或为null，否则执行resize()进行扩容；

　　② 根据键值key计算hash值得到插入的数组索引i，如果table[i]==null，直接新建节点添加，转向⑥，如果table[i]不为空，转向③；

　　③ 判断table[i]的首个元素是否和key一样，如果相同直接覆盖value，否则转向④，这里的相同指的是hashCode以及equals；

　　④ 判断table[i] 是否为treeNode，即table[i] 是否是红黑树，如果是红黑树，则直接在树中插入键值对，否则转向⑤；

　　⑤ 遍历table[i]，判断链表长度是否大于8，大于8的话把链表转换为红黑树，在红黑树中执行插入操作，否则进行链表的插入操作；遍历过程中若发现key已经存在直接覆盖value即可；

　　⑥ 插入成功后，判断实际存在的键值对数量size是否超多了最大容量threshold，如果超过，进行扩容。

posted @ 2017-02-10 22:03 郑斌blog 阅读(925) 评论(0) 收藏举报

刷新页面返回顶部