HashMap put方法源码解析|Java 17

  Put函数源码解析HashMap的put方法执行过程可以通过下图来理解(摘自某大厂的博客,推荐从参考文献的链接去查看原文),自己有兴趣可以去对比源码更清楚地研究学习。

  欲了解更多HashMap,请戳《HashMap知识点梳理、常见面试题和源码分析》。


HashMap Put函数源码流图解

① 判断哈希数组table是否为空或为null,若是则执行resize()进行扩容;
② 根据键值key的hashCode值求得数组索引i,如果table[i]==null,直接添加元素,转向⑥;否则,转向③;
③ 判断table[i]的首个元素是否和key一样,如果相同则覆盖旧的value;否则,转向④,这里的相同指的是hashCode以及equals;
④ 判断table[i] 是否是红黑树,如果是红黑树,则直接在树中插入键值对;否则,转向⑤;
⑤ 判断table[i]的链表长度是否不小于8,不小于8而且数组长度不小于常量64时(图中标记的不准确),把链表转换为红黑树,在红黑树中执行插入操作;否则,在链表尾部插入;遍历过程中若发现key已经存在,则直接覆盖value;
⑥ 插入成功后,判断HashMap中实际存在的键值对数量是否超过最大容量,如果超过,则调用扩容函数resize进行扩容。

  至此,大家对put函数执行流程有了一个大致认识,下面跟着楼兰胡杨看源码吧!Java 8 中,HashMap的实现相比于Java 7做了很大的改变,主要包括以下几点:

  但是,从Java 8 到 Java 13 ,其实现并未改变,下面以 Java 13中 HashMap Put函数源码蓝本,进行分析:

     /**
     * The number of key-value mappings contained in this map.
     * map中键值对个数
     */
    transient int size;
 
    /**
     * 链表转为红黑树的第一个条件:链表元素临界值
     */
    static final int TREEIFY_THRESHOLD = 8;
       /**
    * 链表转红黑树的第二个条件:对数组长度的最低要求。bins就是数组中的各个桶
        * The smallest table capacity for which bins may be treeified.
        * (Otherwise the table is resized if too many nodes in a bin.)
        * Should be at least 4 * TREEIFY_THRESHOLD to avoid conflicts
        * between resizing and treeification thresholds.
        */
        static final int MIN_TREEIFY_CAPACITY = 64;

    /**
     * 红黑树退化为链表的临界值
     */    
    static final int UNTREEIFY_THRESHOLD = 6;
    // 构造函数 put
    public V put(K key, V value) {
        // 对key的hashCode()做hash
        return putVal(hash(key), key, value, false, true);
    }
    

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,boolean evict) {
    //定义一个数组tab,一个Node节点p,n用于存放数组长度,i用于存放key在数组中的索引
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    // 步骤①:判断table是否为空或数组长度为0,如果为空则通过resize()实例化一个数组并让tab作为其引用,并且让n等于实例化tab后的长度
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    // 步骤②:计算数组下标i,并对null做处理
    // 如果首结点值为空,则创建一个新的首结点
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null); 
    else {    // 出现哈希碰撞,开始处理,重新定义一个Node,和一个k
        Node<K,V> e; K k;
      
        // 步骤③:节点key存在,则覆盖旧值
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            e = p;   // 判断元素相等的标准:p与新元素有相同的哈希值和key值
        // 步骤④:判断该链为红黑树
        // 如果首结点的类型是红黑树类型,则按照红黑树方法添加该元素
        else if (p instanceof TreeNode)
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        // 步骤⑤:判断该链为链表
        else {
            for (int binCount = 0; ; ++binCount) {
                // 遍历到链表末尾时再追加该元素,表尾的next节点必然为null
                if ((e = p.next) == null) {
                    //直接将数据写到下个节点
                    p.next = newNode(hash, key, value, null);
                    // 当桶中元素个数不小于8且数组长度不小于64时,把单链表转换成红黑树
                    if (binCount >= TREEIFY_THRESHOLD - 1) 
                        // 链表转红黑树,源码见下一节「桶的树形化」,注意:该方法不一定会将该位置的Node转换成红黑树
                        treeifyBin(tab, hash);
                    break;
                }
                // 如果找到与新元素具有相同的hash和key值的结点,则停止遍历。此时e已经记录了该结点,**直接跳出,不做任何操作**
                if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                p = e;// p指向下一个节点
            }
        }
        if (e != null) { // existing mapping for key
            V oldValue = e.value;
            // 如果允许修改节点,则修改
            if (!onlyIfAbsent || oldValue == null)
               // 用新value覆盖旧值
               e.value = value;
            afterNodeAccess(e);  //节点被访问的回调函数,可根据需要覆盖
            return oldValue; // 返回旧值
        }
    }
    ++modCount; //如果执行到了这里,说明插入了一个新的节点,所以会修改modCount,以及返回null
    //步骤⑥:HashMap中键值对个数超过最大容量时进行扩容
    if (++size > threshold)
        resize();
    afterNodeInsertion(evict); // 这个是空函数,可根据需要覆盖
    return null;
}

  分析:

1 数组tab为null或为空?若是,则resize();
2 计算key的hash值i,若tab[i]==null,新建节点;否则,转入3
3 判断首节点处理hash冲突的方式是链表还是红黑树(check第一个节点类型),分别处理。
例如,链表尾插法——使用链表处理时,利用Node类的next变量来实现链表,把最新的元素放到链表尾部,旧的数据则被最新元素的next变量引用。

确定哈希数组索引位置

  无论是增加和删除操作,还是查找键值对,定位到桶在数组中的位置都是关键的一步。前面说过HashMap的数据结构是数组和单链表的结合,所以当然希望这个HashMap里面的元素位置尽量分布均匀些,尽量使得每个桶里只有一个元素。故当用hash算法求得这个桶的位置时,马上就可以知道此位置的元素就是我们需要的,避免遍历链表,大大优化了查询效率。HashMap定位数组索引位置的函数直接决定了hash方法的离散性能。先看看源码的实现(方法一+方法二):

方法一:
static final int hash(Object key) {   //java 8 和 java 7
     int h;
     // h = key.hashCode() 为第一步 调用hashCode()
     // h ^ (h >>> 16)  为第二步 高16位异或低16位
     return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
方法二:
 //java 7的源码,java 8没有这个方法,但是实现原理一样。length是数组长度。
static int indexFor(int h, int length) {
     return h & (length-1);  //第三步 对数组长度取模运算,计算数组下标
}

  这里的Hash算法本质上可以拆分为三步:取key的hashCode值、高位异或运算、对数组长度取模运算。

  对于任意给定的对象,只要它的hashCode()返回值相同,那么程序调用方法一所计算得到的Hash码值总是相同的。我们首先想到的就是把hash值对数组长度取模运算,这样一来,元素的分布相对来说是比较均匀的。但是,模运算的消耗还是比较大的,在HashMap中是这样做的:调用方法二来计算该对象应该保存在table数组的哪个索引处。

  这个方法非常巧妙,它通过h & (table.length -1)来得到该对象的保存位,而HashMap底层数组的长度总是2的n次方,这是HashMap在速度上的优化。当length总是2的n次方时,与运算 h& (length-1) 等价于对数组长度length取模,也就是h%length,但是&比%具有更高的效率。

  在java 8的实现中,优化了高位运算的算法,通过hashCode()的高16位异或低16位实现的:(h = k.hashCode()) ^ (h >>> 16),主要是从速度、功效、质量来考虑的,这么做可以在数组table的length比较小的时候,也能保证考虑到高低位都参与到数组下标的计算中,同时不会有太大的开销。

桶的树形化

  链表转红黑树的函数 treeifyBin() 并非是直接把链表转成红黑树,而是先判断是扩容还是转成红黑树。源码如下:

//将tab[index] 桶内所有的链表节点转换成红黑树节点
final void treeifyBin(Node<K,V>[] tab, int hash) {
 int n, index; Node<K,V> e;
  //如果当前哈希表为空,或者数组长度小于64,则扩容
 if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
      resize();
  else if ((e = tab[index = (n - 1) & hash]) != null) {
      //数组长度不小于64,进行树形化
      // e 是哈希表中指定桶里的链表节点,从第一个开始
      TreeNode<K,V> hd = null, tl = null; //红黑树的头、尾节点
       do {
           //以当前链表节点 e 新建一个树形节点
           TreeNode<K,V> p = replacementTreeNode(e, null);
           if (tl == null) //确定树头节点
               hd = p;
           else {
              p.prev = tl;
              tl.next = p;
           }
           tl = p;
       } while ((e = e.next) != null); 
       //让桶的第一个元素指向新建的红黑树头节点,以后这个桶里元素存放的数据结构就是红黑树而不是链表了
       if ((tab[index] = hd) != null)
           hd.treeify(tab);
   }
}
   TreeNode<K,V> replacementTreeNode(Node<K,V> p, Node<K,V> next) {
   return new TreeNode<>(p.hash, p.key, p.value, next);
}

结束语

  深入探讨HashMap的结构实现和功能原理。

Reference

posted @ 2020-04-28 22:02  楼兰胡杨  阅读(314)  评论(0编辑  收藏  举报