hashMap线程不安全

jdk1.7中的hashMap在多线程环境下容易出现死循环,主要原因是由于在扩容后,需要将原来的数据转移到新表中使用的是头插法,会是链表翻转;

    void transfer(Entry[] newTable, boolean rehash) {
        int newCapacity = newTable.length;
        for (Entry<K,V> e : table) {
            while(null != e) {
                Entry<K,V> next = e.next;
                if (rehash) {
                    e.hash = null == e.key ? 0 : hash(e.key);
                }
                int i = indexFor(e.hash, newCapacity);
                e.next = newTable[i];
                newTable[i] = e;
                e = next;
            }
        }
    }

  分析图解:

    1:为了方便计算,假设hash算法为key mod链表长度;

    2:初始时数组长度2,key = 3, 7, 5 初始在表table[1]节点;

    3:然后resize后,hash数组长度为4

 

如果不发生异常,正常结果为:

 

然后模拟多线程异常情况:

1:假设线程A在某处挂起

    void transfer(Entry[] newTable, boolean rehash) {
        int newCapacity = newTable.length;
        for (Entry<K,V> e : table) {
            while(null != e) {
                Entry<K,V> next = e.next;
                if (rehash) {
                    e.hash = null == e.key ? 0 : hash(e.key);
                }
                int i = indexFor(e.hash, newCapacity);
                e.next = newTable[i];
                //线程A在此处挂起
                newTable[i] = e;
                e = next;
            }
        }
    }

  

当A挂起后,线程B正常执行完

 

由于线程B已经执行完毕,根据Java内存模型,现在newTable和table中的Entry都是主存中最新值:7.next=3,3.next=null。

此时切换回线程A上,在线程A挂起时继续执行

                            newTable[i]=e ----> newTable[3]=3
                            e=next ----> e=7

继续下一次循环,e=7

 

next=e.next ----> next=3【从主存中取值】
e.next=newTable[3] ----> e.next=3【从主存中取值】
newTable[3]=e ----> newTable[3]=7
e=next ----> e=3

 

 

 

 

 

e不为空继续下一次循环 e=3
next=e.next ----> next=null
e.next=newTable[3] ----> e.next=7 即:3.next=7
newTable[3]=e ----> newTable[3]=3
e=next ----> e=null

 

此次循环后3.next = 7 但上一步 7.next =3 行成环行链表

 

 

 在后续操作中只要涉及轮询hashmap的数据结构,就会在这里发生死循环

其次,1.7中扩容还会出现数据丢失

模拟另外一种情况

 

同样线程A在固定位置挂起

 

 

 线程B完成扩容

 

 

 同样注意由于线程B执行完成,newTable和table都为最新值:5.next=null。

 此时切换到线程A,在线程A挂起时:e=7,next=5,newTable[3]=null。

 执行newtable[i]=e,就将7放在了table[3]的位置,此时next=5。接着进行下一次循环:

    e=5
   next=e.next ----> next=null,从主存中取值
   e.next=newTable[1] ----> e.next=5,从主存中取值
   newTable[1]=e ----> newTable[1]=5
   e=next ----> e=null

将5放置在table[1]位置,此时e=null循环结束,3元素丢失,并形成环形链表。并在后续操作hashmap时造成死循环。

 

 

 

 

 在jdk1.8中对HashMap进行了优化,在发生hash碰撞,不再采用头插法方式,而是直接插入链表尾部,因此不会出现环形链表的情况,但是在多线程的情况下仍然不安全

 多线程在put元素时

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
      //没有hash碰撞时,后续值直接覆盖 if ((p = tab[i = (n - 1) & hash]) == null) tab[i] = newNode(hash, key, value, null); else { Node<K,V> e; K k; if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k)))) e = p; else if (p instanceof TreeNode) e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value); else { for (int binCount = 0; ; ++binCount) { if ((e = p.next) == null) { p.next = newNode(hash, key, value, null); if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st treeifyBin(tab, hash); break; } if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) break; p = e; } } if (e != null) { // existing mapping for key V oldValue = e.value; if (!onlyIfAbsent || oldValue == null) e.value = value; afterNodeAccess(e); return oldValue; } } ++modCount; if (++size > threshold) resize(); afterNodeInsertion(evict); return null; }

如果线程A和线程B同时进行put操作,刚好这两条不同的数据hash值一样,并且该位置数据为null,所以这线程A、B都会进入第6行代码中。

假设一种情况,线程A进入后还未进行数据插入时挂起,而线程B正常执行,从而正常插入数据,然后线程A获取CPU时间片,此时线程A不用再进行hash判断了,

问题出现:线程A会把线程B插入的数据给覆盖,发生线程不安全。

 

  

  

  

posted @ 2020-05-12 11:01  小阿Q的博客  阅读(231)  评论(0)    收藏  举报