ConcurrentHashMap 的 transfer 阅读

　　ConcurrentHashMap 源码目前在网络上已有众多解析。本文章主要关注方法 transfer，试图仔细解析该实现，如有错漏，请指正。

　　ConcurrenthashMap 的 transfer 主要是用于扩容重组阶段，当内部数组的容量值超过阈值时，将触发扩容重组， transfer 是该过程的主要实现。

　　1. 相关概念

　　2. 解析

　　1.相关概念

　　　　1.1 ConcurrentHashMap 中，使用一个字段复用了多种功能，如：阈值控制、内部 Node[] 数组状态控制、扩容线程控制等，该字段就是 sizeCtl。

 1     /**
 2      * <pre>
 3      * 数组初始化和重组时的控制器
 4      * 为负数时：表示表格正在被初始化或重组（resize）
 5      * -1 ：初始化
 6      * -(1+n) ： 重组的线程数 n，也就是说，在修改时，第一个修改的线程应该是：-2，因为 -1 默认初始化
 7      * 当表格为 null 时，使用初始化时指定的大小，或默认为 0
 8      * 初始化完成后，赋值为下次重组 table 的大小的阈值（默认0.75倍）
 9      * </pre>
10      */
11     private transient volatile int sizeCtl;

　　　　1.2 ConcurrentHashMap 在重组时，做法与 HashMap 类似，但是具体新的数组，则是使用了内部一个数组变量 nextTable 以保证并发控制。其他如：链表的重组、树结构的重组流程均是大同小异。

　　　　1.3 ConcurrentHashMap 的重组采用了跟分段表类似的思想，实际上是将数组划分为不同的分段区间，如果有线程进入，可获取该区间辅组转换

　　　　1.4 transferIndex 是 ConcurrentHashMap 的内部属性，主要是在重组阶段中使用，用来表示还未被转换的数组，区间为：table[0] ~ table[transferIndex-1]

　　　　1.5 ConcurrentHashMap 并发转换的过程，借助了信号量的概念，只有获取到信号的线程，才能进入辅组转换，而信号量则存储在 sizeCtl，每当一个线程进入获取，则 sizeCtl + 1（首个线程开启转换则是 sizeCtl + 2）。主要注意的是，该信号量的初始值为负数，加入线程将增大 sizeCtl，直到 sizeCtl 的增大达到 0 时，信号量将用完，默认的与信号量相加等于 0 的值是：65534，也就是说，最多允许 65534 条线程参与辅助转换（非固定，可调节）。所以可通过 "rs + 1 " ~ "rs + 65534 " 的边界控制，来决定线程是否加入辅助转换。让 sizeCtl 成为负数变成信号量的主要代码是：

1 resizeStamp(n) << RESIZE_STAMP_SHIFT

　　　　1.6 ConcurrentHash 的转换过程中，用到的辅助属性有两个：nextTable，transferIndex，它们属于线程共享的，所以在对他们进行变更时，都是使用了 “自旋/死循环 + CAS” 的方式，实现线程并发安全。

　　　　2.解析

　　　　2.1 转换过程 transfer 的每个调用入口，实际上外部都有对 sizeCtl “ 自旋 + CAS ” 的操作。也就是并发情况下，即使多条线程想要进行扩容，那也只有一条线程能够成功，另外的线程则进入辅助扩容的过程，扩容方法进入前的判断如下：

 1             // nt -> nextTable
 2             // n -> num，sc -> sizeCtl
 3             Node<K,V>[] tab, nt; int n, sc;
 4             // 当前存储大于 75%，且总大小小于最大容量，需要扩容
 5             while (s >= (long)(sc = sizeCtl) && (tab = table) != null &&
 6                    (n = tab.length) < MAXIMUM_CAPACITY) {
 7                 // resizeStamp 纯粹只是移位来保证右 16 位为0，可用来控制作为线程最大数
 8                 // 左 16 位实际并没有保留太多信息（因为明显：resizeStamp(4)、resizeStamp(5)、resizeStamp(6)、(7) 是相同的结果
 9                 int rs = resizeStamp(n) << RESIZE_STAMP_SHIFT;
10                 if (sc < 0) {
11                     // 限制线程的最大或最小，当达到最大 65535（默认） 或 1 条时，则直接跳出
12                     // rs + 1 --> 最少线程数（相当于不正确的情况了，或者是初始化，因为起始时最少是 rs + 2）
13                     // rs + MAX_RESIZERS --> 最多线程数
14                     // 或其他情况，则不再辅助转移，如：nextable 已为 null 或 transferIndex <= 0（说明已结束）
15                     // 前两个条件是限制线程数，后两个条件是扩容已经结束
16                     if (sc == rs + MAX_RESIZERS || sc == rs + 1 ||
17                         (nt = nextTable) == null || transferIndex <= 0)
18                         break;
19                     if (U.compareAndSetInt(this, SIZECTL, sc, sc + 1))
20                         transfer(tab, nt);
21                 }
22                 // 如果 sc >= 0，说明是刚开始，因为 sc < 0 时，表示有多少条线程在进行转移是：sc - 1
23                 // 所以这里要 rs + 2
24                 else if (U.compareAndSetInt(this, SIZECTL, sc, rs + 2))
25                     transfer(tab, null);
26                 s = sumCount();
27             }

　　　　这里出现大量的判断比较，容易造成混乱，但主要记住：这些判断比较，在 ConcurrentHashMap 大部分是边界判断。记住这点后能够帮助理解大部分的判断比较，比如：sc == rs + MAX_RESIZERS 和 sc == rs + 1 实际上是对线程数的上下界的限制，超过限制，则不进入辅助转换。

　　　　2.2 ConcurrentHashMap 是分段进行并发转换，就是一个数组，按 “ 幅度 ” 划分，然后相应的线程获取到哪个分组，则负责该分组的转换的完成。那么出口在哪里呢？只有当所有线程都执行完毕，处理转换的线程的信号量没有被获取了，才退出整个转换过程。默认最小幅度是 16，也就是说线程的最少处理元素个数是 16 个。

 1         // stride 幅度
 2         int n = tab.length, stride;
 3         // 如果 CPU 大于 1，控制最少每个线程的处理量为 16 ==> n / 8 / NCPU
 4         if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)
 5             stride = MIN_TRANSFER_STRIDE; // subdivide range
 6         if (nextTab == null) {            // initiating
 7             try {
 8                 // 数组翻倍，为什么要多出一个赋值操作？是因为 new 操作可能异常？貌似也不影响
 9                 @SuppressWarnings("unchecked")
10                 Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n << 1];
11                 nextTab = nt;
12             } catch (Throwable ex) {      // try to cope with OOME
13                 // 失败，直接增加数组大小，退出
14                 sizeCtl = Integer.MAX_VALUE;
15                 return;
16             }
17             // 因为本方法的外层调用都使用了 CAS，所以可以保证此赋值的正确性（多线程情况下）
18             nextTable = nextTab;
19             // table 大小，最开始的转换范围是原数组大小
20             transferIndex = n;
21         }

　　　　2.3 进入转换方法后，首先就是确定线程处理幅度，然后初始化 nextTable （如果需要的话），并初始化转换过程中需要用到的一些辅助属性，如：transferIndex = n = table.length。

　　　　2.4 接下来，就是一个死循环（假象）。死循环内嵌死循环。第一个死循环使用到了局部参数 i 和 bound，实际上，在每个线程进入该方法后，都会获得自己这两个局部变量值，而它们的值变动则是在内部循环中开始赋值，一旦赋值成功，那么第一个死循环就变成了一个有界的 for 循环

　　　　2.5 优先看第二个内部循环， advance 变量控制了该循环。advance 变量主要表示：是否推进到下一个元素。它实际与 i 和 bound 是有逻辑关系的，一旦 i 和 bound 的关系不匹配，那么 advance 也就必须为 false，不再让线程进行推进，推进的操作是（ --i ）。也就是说，线程进入后，将有三个变量控制其运行，其中 bound, i 是线程处理的数组边界，而 advance 则控制线程在这个边界中进行移动

 1         int nextn = nextTab.length;
 2         ForwardingNode<K,V> fwd = new ForwardingNode<K,V>(nextTab);
 3         // 是否推进到下一个元素，false 则表示还是处理当前元素
 4         boolean advance = true;
 5         boolean finishing = false; // to ensure sweep before committing nextTab
 6         for (int i = 0, bound = 0;;) {
 7             // f -> findNode；fh -> findNode hash
 8             Node<K,V> f; int fh;
 9             // 死循环主要是为了划分线程处理区间 ！还有控制元素推进
10             while (advance) {
11                 int nextIndex, nextBound;
12                 // 死循环标志位，不断死循环执行处理，没有太多意义，纯粹依靠标志位
13                 // 每一个线程进来，第一个判断都不成立
14                 // 通过 --i 来控制线程处理区间的推进，
15                 // 如果 --i > bound 说明区间范围超过线程的处理范围，线程不再该范围内就行推进，标志位为false
16                 // 每一次划分完，则 i 实际上是闭区间的尾部，而 bound 则为区间的首部，所以 --i 成功，进入区间下一个元素处理
17                 if (--i >= bound || finishing)
18                     advance = false;
19                 else if ((nextIndex = transferIndex) <= 0) {
20                     // 赋值 nextIndex
21                     // 小于0 ：表已被划分完，不再作划分推进，跳出循环
22                     i = -1;
23                     advance = false;
24                 }
25                 else if (U.compareAndSetInt
26                          (this, TRANSFERINDEX, nextIndex,
27                           nextBound = (nextIndex > stride ?
28                                        nextIndex - stride : 0))) {
29                     // CAS 替换值，将 transferIndex 更新为 transferIndex - stride
30                     // 控制此线程的处理区间为：bound ~ (nextIndex - 1)
31                     // 假定初始表大小为 35，2个线程进入（其实跟线程数无关，跟 CPU 有关），NCPU = 2 ，则幅度控制下为 16
32                     // 通过循环，划分下为：
33                     // 19 ~ 34
34                     // 3 ~ 18
35                     // 0 ~ 2
36                     // 也就说，transfer 的处理，（单线程）是从尾部到头部（当然总体情况下多线程则取决于线程的执行情况）
37                     bound = nextBound;
38                     i = nextIndex - 1;
39                     advance = false;
40                 }
41             }

　　　　可以看到，内部死循环的主要作用，其实是为了划分分区（划分幅度为 stride），也可以意识到，即使是单线程，其执行也是按分区执行，并且执行的分区顺序是从尾部到首部。通过 CAS 保证分区的划分的线程安全，失败则重新循环再次操作。

　　　　2.6 划分完分区后，剩下的就是线程的处理过程。处理过程包括 2 部分，一部分是普通的元素处理，一部分是边界控制——退出出口。

　　　　在每一个元素的处理过程中，线程都会先判断是否到达出口，是则退出？差不离，但退出包含两种情况，一种是普通的辅助线程的退出，它只擦自己的屁股，另外一种是整体线程的退出，它除了处理负责自己的退出出口，还要负责将重组后的结果 nextTable 重复赋值给 table，并为 sizeCtl 赋值为新数组大小的 0.75 倍的阈值

 1             // 如果 i < 0 || i >= n || i + n >= nextn ，都属于区间的边界判断
 2             // 超过边界则判断是否线程都已执行完毕，其实只有首尾区间的线程会触发到这个判断，
 3             // 其他的线程因为 stride < i < 2stride，所以不会触发此判断
 4             if (i < 0 || i >= n || i + n >= nextn) {
 5                 int sc;
 6                 // 扩容出口
 7                 // 只有当 finishing 为 true 时，才真正将 nextTable 赋值给 旧 table 指针
 8                 // 而 finishing 为 true 的唯一条件，是所有的线程都执行完毕
 9                 if (finishing) {
10                     nextTable = null;
11                     table = nextTab;
12                     // 翻倍减去 0.25 ，得 1.75 ，为新数组大小的 0.75 倍的阈值
13                     sizeCtl = (n << 1) - (n >>> 1);
14                     return;
15                 }
16                 if (U.compareAndSetInt(this, SIZECTL, sc = sizeCtl, sc - 1)) {
17                     if ((sc - 2) != resizeStamp(n) << RESIZE_STAMP_SHIFT)
18                         return;
19                     // 只有当所有的线程都执行完毕，才能保证 finishing 为 true
20                     finishing = advance = true;
21                     i = n; // recheck before commit
22                 }
23             }

　　　　说完了边界出口，剩下的就是普通的操作了，有以下判断：

　　　　当线程转换时旧数组对应位置上为 null，则直接 CAS 替换为 ForwardingNode（其 hash = MOVED），表示转移过了；此时，当外部有操作 put 刚好命中此位置时，将会进入辅助转换的过程，判断依据就是 if (hash == MOVED)。也就是说，在重组转换过程中，进行 put 操作，将进入辅助转换过程。

　　　　如果 hash 为 MOVED，则表示该位置已被其他线程转移过，推进到下一个元素

　　　　最后，进入与 HashMap 相同的链表重组和树结构重组的逻辑中，成功执行后，advance = true，继续推进处理元素（--i）。这里比 HashMap 多出一步，就是将旧数组对应位置上的标记为已处理。

 1             else if ((f = tabAt(tab, i)) == null)
 2                 advance = casTabAt(tab, i, null, fwd);　　　// 如果旧表该位置为null，则标记为已处理
 3             else if ((fh = f.hash) == MOVED)               // 感觉不太可能遇到，毕竟线程单一负责自己的区域（？）
 4                 advance = true; // already processed
 5             else {
 6                 // 进入转换
 7                 synchronized (f) {
 8                     if (tabAt(tab, i) == f) {
 9                         Node<K,V> ln, hn;
10                         // 普通链表的 hash 节点是正常的 hash 码，树节点的 hash 则默认小于 0
11                         // 重哈希算法与 HashMap 相同，都是以 2的n次幂 对应的二进制刚好为 1，
12                         // 直接移动高位部分元素
13                         if (fh >= 0) {}
14                         else if (f instanceof TreeBin) {
15                            setTabAt(nextTab, i, ln);
16 　　　　　　　　　　　         setTabAt(nextTab, i + n, hn);
17 　　　　　　　　　　　         // 处理完成后，将旧数组的节点标记为已处理（旧数据将没有数据）
18 　　　　　　　　　　　         setTabAt(tab, i, fwd); 
19 　　　　　　　　　　　　　　 }
20                         else if (f instanceof ReservationNode)

　　　　至此，整个 ConcurrentHashMap 的转换过程算完了，整个解析感觉还是有理有据，如有错误，必当改正。

　　　　文末，再总结下其中一些比较容易忽视或难以理解的点：

大多数看起来复杂混乱的判断，其实是边界判断
整个大方法使用了 死循环+CAS 的方式控制并发
以幅度划分线程处理的数组范围就是使用 "死循环 + CAS" 完成的
实现如果出现异常，导致多线程下，某个线程没有执行出口的逻辑，没有成功扣减 ConcurrentHashMap 的 sizeCtl 的线程数，是否会进入一个错误状态并无法退出转换过程（未验证）
控制线程数量，实际上是复用了 sizeCtl 这个变量，先保留部分信息后左移，并空出右 16 位来进行线程量的增加

流程图如下：

posted @ 2020-11-17 23:15 阿全啊阅读(289) 评论(2) 收藏举报

刷新页面返回顶部

阿全啊

ConcurrentHashMap 的 transfer 阅读

1.相关概念

2.解析

公告

　　1.相关概念

　　　　2.解析