HashMap

JDK1.8 HashMap 源码

put操作

    //put方法
    public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
    }

    /**
     * Implements Map.put and related methods
     *
     * @param hash         hash for key
     * @param key          the key
     * @param value        the value to put
     * @param onlyIfAbsent if true, don't change existing value
     * @param evict        if false, the table is in creation mode.
     * @return previous value, or null if none
     */
    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K, V>[] tab;
        Node<K, V> p;
        int n, i;
        //判断当前数组是否为空，空则初始化
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        //对应数组位置无元素则直接添加
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {
            Node<K, V> e;
            K k;
            //当前数组位置key相等则直接替换
            if (p.hash == hash &&
                    ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
                //当前key不是要put的元素的key，是红黑树结构
            else if (p instanceof TreeNode)
                e = ((TreeNode<K, V>) p).putTreeVal(this, tab, hash, key, value);
            else {
                //链表结构遍历，插入到链表尾部，JDF1.7插入到链表头部
                for (int binCount = 0; ; ++binCount) {
                    //next为空说明没有，直接插入
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        //新插入后，链表长度大于阈值，链表变红黑树
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    //key已存在，对应Node为 e
                    if (e.hash == hash &&
                            ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            //当前key已存在
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                //   put(key,value) 返回值为 key对应的旧值，没有则返回null
                return oldValue;
            }
        }
        ++modCount;
　　　　　// 扩容， map.size()> 容量*负载因子
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

数组扩容

　　扩容， map.size()> 容量*负载因子；或者初始化

// 扩容兼初始化
	final Node<K, V>[] resize() {
		Node<K, V>[] oldTab = table;
		int oldCap = (oldTab == null) ? 0 : oldTab.length;// 数组长度
		int oldThr = threshold;// 临界值
		int newCap, newThr = 0;
		if (oldCap > 0) {
			// 扩容
			if (oldCap >= MAXIMUM_CAPACITY) {
				// 原数组长度大于最大容量(1073741824) 则将threshold设为Integer.MAX_VALUE=2147483647
				// 接近MAXIMUM_CAPACITY的两倍
				threshold = Integer.MAX_VALUE;
				return oldTab;
			} else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY && oldCap >= DEFAULT_INITIAL_CAPACITY) {
				// 新数组长度 是原来的2倍，
				// 临界值也扩大为原来2倍
				newThr = oldThr << 1;
			}
		} else if (oldThr > 0) {
			// 如果原来的thredshold大于0则将容量设为原来的thredshold
			// 在第一次带参数初始化时候会有这种情况
			newCap = oldThr;
		} else {
			// 在默认无参数初始化会有这种情况
			newCap = DEFAULT_INITIAL_CAPACITY;// 16
			newThr = (int) (DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);// 0.75*16=12
		}
		if (newThr == 0) {
			// 如果新 的容量 ==0
			float ft = (float) newCap * loadFactor;// loadFactor 哈希加载因子 默认0.75,可在初始化时传入,16*0.75=12 可以放12个键值对
			newThr = (newCap < MAXIMUM_CAPACITY && ft < (float) MAXIMUM_CAPACITY ? (int) ft : Integer.MAX_VALUE);
		}
		threshold = newThr;// 将临界值设置为新临界值
		@SuppressWarnings({ "rawtypes", "unchecked" })
		// 扩容
		Node<K, V>[] newTab = (Node<K, V>[]) new Node[newCap];
		table = newTab;
		// 如果原来的table有数据，则将数据复制到新的table中
		if (oldTab != null) {
			// 根据容量进行循环整个数组，将非空元素进行复制
			for (int j = 0; j < oldCap; ++j) {
				Node<K, V> e;
				// 获取数组的第j个元素
				if ((e = oldTab[j]) != null) {
					oldTab[j] = null;
					// 如果链表只有一个，则进行直接赋值
					if (e.next == null)
						// e.hash & (newCap - 1) 确定元素存放位置
						newTab[e.hash & (newCap - 1)] = e;
					//  此处省略红黑树
					else {
						// 进行链表复制
						// 方法比较特殊： 它并没有重新计算元素在数组中的位置
						// 而是采用了 原始位置加原数组长度的方法计算得到位置
						Node<K, V> loHead = null, loTail = null;
						Node<K, V> hiHead = null, hiTail = null;
						Node<K, V> next;
						do {
							/*********************************************/
							/**
							 * 注: e本身就是一个链表的节点，它有 自身的值和next(链表的值)，但是因为next值对节点扩容没有帮助，
							 * 所有在下面讨论中，我近似认为 e是一个只有自身值，而没有next值的元素。
							 */
							/*********************************************/
							next = e.next;
							// 注意：不是(e.hash & (oldCap-1));而是(e.hash & oldCap)

							// (e.hash & oldCap) 得到的是 元素的在数组中的位置是否需要移动,示例如下
							// 示例1：
							// e.hash=10 0000 1010
							// oldCap=16 0001 0000
							//	 &   =0	 0000 0000       比较高位的第一位 0
							//结论：元素位置在扩容后数组中的位置没有发生改变
							
							// 示例2：
							// e.hash=17 0001 0001
							// oldCap=16 0001 0000
							//	 &   =1	 0001 0000      比较高位的第一位   1
							//结论：元素位置在扩容后数组中的位置发生了改变，新的下标位置是原下标位置+原数组长度
							
							// (e.hash & (oldCap-1)) 得到的是下标位置,示例如下
							//   e.hash=10 0000 1010
							// oldCap-1=15 0000 1111
							//      &  =10 0000 1010
								
							//   e.hash=17 0001 0001
							// oldCap-1=15 0000 1111
							//      &  =1  0000 0001
							
							//新下标位置
							//   e.hash=17 0001 0001
							// newCap-1=31 0001 1111    newCap=32
							//      &  =17 0001 0001    1+oldCap = 1+16
							
							//元素在重新计算hash之后，因为n变为2倍，那么n-1的mask范围在高位多1bit(红色)，因此新的index就会发生这样的变化：
							//参考博文：[Java8的HashMap详解](https://blog.csdn.net/login_sonata/article/details/76598675)  
							// 0000 0001->0001 0001

							if ((e.hash & oldCap) == 0) {
								// 如果原元素位置没有发生变化
								if (loTail == null)
									loHead = e;// 确定首元素
								// 第一次进入时	  e   -> aa  ; loHead-> aa
								else
									loTail.next = e;
								//第二次进入时		loTail-> aa  ;    e  -> bb ;  loTail.next -> bb;而loHead和loTail是指向同一块内存的，所以loHead.next 地址为 bb  
								//第三次进入时		loTail-> bb  ;    e  -> cc ;  loTail.next 地址为 cc;loHead.next.next = cc
								loTail = e;
								// 第一次进入时   	  e   -> aa  ; loTail-> aa loTail指向了和  loHead相同的内存空间
								// 第二次进入时               e   -> bb  ; loTail-> bb loTail指向了和  loTail.next（loHead.next）相同的内存空间   loTail=loTail.next
								// 第三次进入时               e   -> cc  ; loTail-> cc loTail指向了和  loTail.next(loHead.next.next)相同的内存
							} else {
								//与上面同理
								
								if (hiTail == null)
									hiHead = e;
								else
									hiTail.next = e;
								hiTail = e;
							}
						} while ((e = next) != null);//这一块就是 旧链表迁移新链表
						//总结：1.8中 旧链表迁移新链表    链表元素相对位置没有变化; 实际是对对象的内存地址进行操作 
						//在1.7中  旧链表迁移新链表        如果在新表的数组索引位置相同，则链表元素会倒置
						if (loTail != null) {
							loTail.next = null;// 将链表的尾节点 的next 设置为空
							newTab[j] = loHead;
						}
						if (hiTail != null) {
							hiTail.next = null;// 将链表的尾节点 的next 设置为空
							newTab[j + oldCap] = hiHead;
						}
					}
				}
			}
		}
		return newTab;
	}

JDK1.7以前多线程插入会有死循环问题：

单线程过程

两个线程操作

JDK1.8以后没有死循环问题，但是会有数据丢失：

　　比如有两个线程A和B，首先A希望插入一个key-value对到HashMap中，首先计算记录所要落到的 hash桶的索引坐标，然后获取到该桶里面的链表头结点，此时线程A的时间片用完了，而此时线程B被调度得以执行，和线程A一样执行，只不过线程B成功将记录插到了桶里面，假设线程A插入的记录计算出来的 hash桶索引和线程B要插入的记录计算出来的 hash桶索引是一样的，那么当线程B成功插入之后，线程A再次被调度运行时，它依然持有过期的链表头但是它对此一无所知，以至于它认为它应该这样做，如此一来就覆盖了线程B插入的记录，这样线程B插入的记录就凭空消失了，造成了数据不一致的行为。

链表转红黑树

　　被树化的要求是当数组的某一个索引位置上的元素以链表形式存在的数据个数 > 8 且当前数组的长度 > 64时

    /**
     * Replaces all linked nodes in bin at index for given hash unless
     * table is too small, in which case resizes instead.
     */
    final void treeifyBin(Node<K, V>[] tab, int hash) {
        int n, index;
        Node<K, V> e;
        //MIN_TREEIFY_CAPACITY：桶中的Node被树化时最小的hash表容量:64
        //即被树化的要求是  当数组的某一个索引位置上的元素以链表形式存在的数据个数 > 8 且当前数组的长度 > 64时
        if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
            resize();
        else if ((e = tab[index = (n - 1) & hash]) != null) {
            TreeNode<K, V> hd = null, tl = null;
            do {
                TreeNode<K, V> p = replacementTreeNode(e, null);
                if (tl == null)
                    hd = p;
                else {
                    p.prev = tl;
                    tl.next = p;
                }
                tl = p;
            } while ((e = e.next) != null);
            if ((tab[index] = hd) != null)
                hd.treeify(tab);
        }
    }

参考：

https://www.cnblogs.com/yucfeng/p/9035308.html

https://blog.csdn.net/u013494765/article/details/77837338

https://www.bilibili.com/video/BV1vE411v7cR?p=4

posted @ 2020-05-05 17:28 zzmhust 阅读(166) 评论(0) 收藏举报

刷新页面返回顶部

zzmhust

HashMap

JDK1.8 HashMap 源码

put操作

数组扩容

扩容， map.size()> 容量*负载因子；或者初始化

单线程过程

两个线程操作

链表转红黑树

被树化的要求是 当数组的某一个索引位置上的元素以链表形式存在的数据个数 > 8 且当前数组的长度 > 64时

公告

　　扩容， map.size()> 容量*负载因子；或者初始化

　　被树化的要求是当数组的某一个索引位置上的元素以链表形式存在的数据个数 > 8 且当前数组的长度 > 64时