高效读写的队列：ConcurrentLinkedQueue

队列（Queue）也是常用的数据结构之一。在JDK中提供了一个ConcurrentLinkedQueue类用来实现高并发的队列。从名字可以看出，这个队列是使用链表作为其数据的结构的。ConcurrentLinkedQueue应该算是在高并发的环境中性能最好的了。它之所以有很好的性能，是因为其内部复杂的实现。下面我们就来一探究竟，为何性能高？

ConcurrentLinkedQueue的介绍

　　ConcurrentLinkedQueue是一个基于链表的无界非阻塞队列，并且是线程安全的，它采用的是先进先出的规则，当我们增加一个元素时，它会添加到队列的末尾，当我们取一个元素时，它会返回一个队列头部的元素。

ConcurrentLinkedQueue原理探究

　　作为一个链表，自然需要定义有关链表内的节点，在ConcurrentLinkedQueue中，定义的节点Node核心如下：

 1 static final class Node<E> {
 2         volatile E item;
 3         volatile Node<E> next;
 4 
 5         /**
 6          * Constructs a node holding item.  Uses relaxed write because
 7          * item can only be seen after piggy-backing publication via CAS.
 8          */
 9         Node(E item) {
10             ITEM.set(this, item);
11         }
12 
13         /** Constructs a dead dummy node. */
14         Node() {}
15 
16         void appendRelaxed(Node<E> next) {
17             // assert next != null;
18             // assert this.next == null;
19             NEXT.set(this, next);
20         }
21 
22         boolean casItem(E cmp, E val) {
23             // assert item == cmp || item == null;
24             // assert cmp != null;
25             // assert val == null;
26             return ITEM.compareAndSet(this, cmp, val);
27         }
28     }

其中 item是用来表示目标元素的。比如，但队列中存放String时，item就是String类型。字段next表示当前Node的下一个元素，这样每个Node就能环环相扣，串在一起了。

方法casItem()表示设置当前Node的item值。它需要两个参数，第一个参数为期望值，第二个参数为设置目标值。当当前值等于cmp期望值时，它就会将目标设置为val。这个方法使用了CAS操作。

head和tail

ConcurrentLinkedQueue内部有两个重要的字段head和tail，分别表示链表的头部和尾部，他们都是Node类型，对于head来说，它永远不会为null，并且通过head以及succ()后继方法一定能完整的遍历整个链表。对于tail来说，它自然应该表示队列的末尾。但ConcurrentLinkedQueue的内部实现非常复杂，它允许在运行时链表处于多个不同的状态。以tail来说，我们期望tail总是为链表的末尾，但实际上，tail的更新并不是及时的，而是可能会产生拖延现象。来看一下源码：

offer()：将指定的元素插入队列的尾部

 1 public boolean offer(E e) {
 2         final Node<E> newNode = new Node<E>(Objects.requireNonNull(e));
 3 
 4         for (Node<E> t = tail, p = t;;) {
 5             Node<E> q = p.next;
 6             if (q == null) {
 7                 // p是最后一个节点
 8                 if (NEXT.compareAndSet(p, null, newNode)) {
 9                     if (p != t) // 每两次更新一下tail
10                         TAIL.weakCompareAndSet(this, t, newNode);
11                     return true;
12                 }
13                 // CAS竞争失败，再次尝试
14             }
15             else if (p == q)
16                 // 遇到哨兵节点，从head开始遍历
17                 //但是如果tail被修改，则使用tail（因为可能被修改正确了）
18                 p = (t != (t = tail)) ? t : head;
19             else
20                 // 每两次更新后，确认tail更新
21                 p = (p != t && t != (t = tail)) ? t : q;
22         }
23     }

　　首先值得注意的是，这个方法没有任何的锁操作。线程安全完全由CAS操作和队列的算法来保证。整个方法的核心是for循环，这个循环没有出口，直到尝试成功，这也符合CAS的操作流程。当第一次加入元素时，由于队列为空，因此p.next为null。程序进入第8行，将p的next节点赋值为newNode也就是将新的元素加入到队列中。此时p==t成立，因此并不会执行第9行代码更新tail末尾，如果 NEXT.compareAndSet(p, null, newNode) 成功，程序直接返回，如果失败，则再进行一次循环尝试，直到成功。因此，增加一个元素后，tail并不会被更新。此时队列是这样的：

　　当程序试图增加第二个元素时，这时tail在head的位置上，因此t表示的就是head，所以p.next就是Node1（即第一个元素），此时q != null ，p != q ，所以程序进入else环节，运行第21行代码，获得最后一个节点，此时 p = q，即p指向链表的第一个元素Node1，开始第二个循环，p.next = null，所以程序执行第8行代码，p更新自己的next，让它指向新加入的节点，如果成功，此时 p != t 为true，这样就更新t的所在位置，将t移到链表的最后，即更新tail（这时tail才是链表的末尾）。

　　所以tail的更新会产生滞后，并且每两次会跳跃两个元素。如下图所示：

再来看代码的第15行，对p = q 的情况进行了处理；这种情况就属于遇到了哨兵节点导致的。所谓的哨兵节点就是next指向了自己。这种节点在队列中存在的价值不大，主要表示要删除的节点或者空节点，当遇到哨兵节点时，无法通过next取得后续的节点，通过代码第18行，很可能直接返回head，这样链表就会从头部开始遍历，重新查找到链表末尾。当然也有可能返回t，这样就进行了一次“打赌”，使用新的tail作为链表尾部（即t），这样避免了重新查找tail的开销。

对代码的第18行，进行分析： p = (t != (t = tail)) ? t : head

　　这句代码虽然只有一行，但是包含的信息比较多。首先“!=”不是原子操作，它是可以被中断的，也就是说，在执行“!=”时，程序会先取得t的值，在执行t = tail，并取得新的t的值，然后比较这两个值是否相等。在单线程中,t != t这种语句显然不会成立，但是在并发环境下，有可能在获得左边的t值后，右边的t值被其他线程修改，这样，t != t 就成立了。这种情况表示在比较的过程中，tail被其他线程修改了，这时，我们就用新的tail为链表的尾，也就是等式右边的t，但如果tail没有被修改，则返回head，要求从头部开始，重新查找链表末尾。

poll() ：获取并移除队列的头，如果队列为空则返回null

先来看源代码：

 1 public E poll() {
 2         restartFromHead: for (;;) {
 3             for (Node<E> h = head, p = h, q;; p = q) {
 4                 final E item;
 5                 if ((item = p.item) != null && p.casItem(item, null)) {
 6                     // Successful CAS is the linearization point
 7                     // for item to be removed from this queue.
 8                     if (p != h) // hop two nodes at a time
 9                         updateHead(h, ((q = p.next) != null) ? q : p);
10                     return item;
11                 }
12                 else if ((q = p.next) == null) {
13                     updateHead(h, p);
14                     return null;
15                 }
16                 else if (p == q)
17                     continue restartFromHead;
18             }
19         }
20     }

说明：poll()方法的作用就是删除链表的表头节点，并返回被删除节点的值。poll()的实现原理和offer()比较相似，下面对其分析：

代码的第5行表示：表头节点的数据不为null，并且设置表头数据为null的操作成功。然后进入if，如果 p != h 为true，则更新表头然后返回删除元素的值item，若为false，则直接返回删除元素的值，不更新表头。这点说明表头head也不是实时更新的，也是每两次更新一次（通过注释：hop two nodes at a time），跟tail的更新类似。

代码的第12行，表示表头的下一个节点为null，即链表只有一个内容为null的表头节点。这样则直接更新表头为p，返回null。

代码的第16行，当p == q 时，跳过当前循环，跳到restartFromHead标记重新操作。

即ConcurrentLinkedQueue的元素删除示意图如下所示：

ConcurrentLinkedQueue的其他方法：

　　peek()：获取表头元素但不移除队列的头，如果队列为空则返回null。

　　remove(Object obj)：移除队列已存在的元素，返回true，如果元素不存在，返回false。

　　add(E e)：将指定元素插入队列末尾，成功返回true，失败返回false（此方法非线程安全的方法，不推荐使用）。

注意：

　　虽然ConcurrentLinkedQueue的性能很好，但是在调用size()方法的时候，会遍历一遍集合，对性能损害较大，执行很慢，因此应该尽量的减少使用这个方法，如果判断是否为空，最好用isEmpty()方法。

　　ConcurrentLinkedQueue不允许插入null元素，会抛出空指针异常。

　　ConcurrentLinkedQueue是无界的，所以使用时，一定要注意内存溢出的问题。即对并发不是很大中等的情况下使用，不然占用内存过多或者溢出，对程序的性能影响很大，甚至是致命的。

通过以上这些说明，可以明显的感觉到，不使用锁而单纯的使用CAS操作要求在应用层面上保证线程安全，并处理一些可能存在的不一致问题，大大增加了程序的设计和实现的难度。但是它带来的好处就是可以得到性能的飞速提升。因此，有些场合也是值得的。

参考：《Java高并发程序设计》葛一鸣郭超编著：

posted on 2018-10-10 10:45 AoTuDeMan 阅读(9539) 评论(4) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

AoTuDeMan