JDK成长记19：ReenranctLock（2）加锁入队的AQS底层原理

上一节，你应该学到了ReentrantLock底层基于AQS的3个小组件 state、owner、queue。并且了解了下一个线程1进行加锁修改owner和state的过程。还记得么？加锁成功后，如下图所示的状态：

首次加锁的时候，只使用到了owner和state这两个小组件，并没有涉及到等待队列。所以这一节，我们继续看一下，如果有下一个线程—线程2，这个哥们过来加锁会是如何的？

直接从JDK源码层面理解AQS的另一个线程也来加锁的入队逻辑

当线程2这个哥们进行加锁的时候，假设线程1还没有释放锁，也就是基于上面的图的状态，线程2进行加锁。同样会走到如下lock方法的代码：

 static final class NonfairSync extends Sync {
   final void lock() {
     if (compareAndSetState(0, 1))
       setExclusiveOwnerThread(Thread.currentThread());
     else
       acquire(1);
   }


   protected final boolean tryAcquire(int acquires) {
     return nonfairTryAcquire(acquires);
   }
  }

如果线程2进行lock，当执行compareAndSetState(0,1)的时候，由于state此时已经是1了，肯定会CAS操作失败，计入else逻辑，在NonFairSync的父类AQS中可以找到如下代码：

public final void acquire(int arg) {
  if (!tryAcquire(arg) &&
    acquireQueued(addWaiter(Node.EXCLUSIVE), arg))
    selfInterrupt();
 }



// 接着又会调用NonFairSync实现的tryAcquire：

  protected final boolean tryAcquire(int acquires) {
    return nonfairTryAcquire(acquires);
  }



final boolean nonfairTryAcquire(int acquires) {
    final Thread current = Thread.currentThread();
    int c = getState();
    if (c == 0) {
     if (compareAndSetState(0, acquires)) {
        setExclusiveOwnerThread(current);
        return true;
      }
    }

    else if (current == getExclusiveOwnerThread()) {
      int nextc = c + acquires;
      if (nextc < 0) // overflow
        throw new Error("Maximum lock count exceeded");
      setState(nextc);
      return true;
    }
    return false;
  }

这个上面的tryAcquire方法实际调用了一个nonfairTryAcquire，从名字上看，叫做非公平获取的一个方法。（后面讲非公平锁的会讲到）。

但是当你看过这个方法的脉络你会发现，state是1，第一个if不满足，owner是线程1，当前是线程2，第二个if也不满足，结果直接返回了false。

所以到这里你会发现线程2加锁，截止到现在，会执行到如下图所示步骤3所示：

接着由于tryAcquire返回false，会进入&&后面的方法调用addWaiter(Node.EXCLUSIVE)。

public final void acquire(int arg) {
 if (!tryAcquire(arg) &&
   acquireQueued(addWaiter(Node.EXCLUSIVE), arg))
   selfInterrupt();
}

addWaiter从名字上，你可以连蒙带猜下，其实这个方法的意思就是添加到等待队列的进行等待的意思。让我们来看下：

  private Node addWaiter(Node mode) {
   Node node = new Node(Thread.currentThread(), mode);
   // Try the fast path of enq; backup to full enq on failure
   Node pred = tail;
   if (pred != null) {
     node.prev = pred;
     if (compareAndSetTail(pred, node)) {
       pred.next = node;
       return node;
     }
   }

   enq(node);
   return node;
  }

首先传入的是一个Node mode，就是Node.EXCLUSIVE,从名字上看就是一个独占Node的意思。

你可以这个Node.EXCLUSIVE看下：

static final class Node {
  /** Marker to indicate a node is waiting in shared mode */
  static final Node SHARED = new Node();
  /** Marker to indicate a node is waiting in exclusive mode */
  static final Node EXCLUSIVE = null;


  /** waitStatus value to indicate thread has cancelled */
  static final int CANCELLED = 1;

  /** waitStatus value to indicate successor's thread needs unparking */
  static final int SIGNAL  = -1;

  /** waitStatus value to indicate thread is waiting on condition */
  static final int CONDITION = -2;

  /**
   * waitStatus value to indicate the next acquireShared should
   * unconditionally propagate
   */
  static final int PROPAGATE = -3;

}

果然，你可以看到Node中有一堆静态变量，通过null，空Node、1、1、-2、-3表示一些Node的角色类型。

接着往下看addWaitder方法：

  private Node addWaiter(Node mode) {
   Node node = new Node(Thread.currentThread(), mode);
     //省略后面代码
   return node;

  }

这个new Node又做了什么？可以看下Node的构造方法和成员变量：

volatile Node prev;

volatile Node next;

volatile int waitStatus;

volatile Thread thread;

Node nextWaiter;



Node(Thread thread, Node mode) {   // Used by addWaiter
 this.nextWaiter = mode;
 this.thread = thread;

}

除了next、prev、thread表示双向链表的前后指针和对应的数据元素之外，还有两个变量nextWaiter和waitStatus。可以从名字上猜出来，表示等待节点和等待状态的意思。

这里传入了thread=线程2，mode= EXCLUSIVE = null 。其实nextWaiter这里更像是个标记，表示独占类型的Node。或者说是线程2正在等待的是一个独占锁。创建的node如下图所示：

接着addwaiter创建完成节点node后，继续执行代码pred指针指向tail，但是默认tail是null，所以直接调用enq(node)方法，看样子是要进行入队。enqueue的意思。代码如下：

 private Node addWaiter(Node mode) {

  Node node = new Node(Thread.currentThread(), mode);
  // Try the fast path of enq; backup to full enq on failure
  Node pred = tail;
  if (pred != null) {
    node.prev = pred;
    if (compareAndSetTail(pred, node)) {
      pred.next = node;
      return node;
    }
  }

  enq(node);
  return node;

 }

执行到这里就会得到如下结果：

AQS的本质：为啥叫做异步队列同步器？

接着我们需要分析下enq(node)这个入队方法了：

private Node enq(final Node node) {
  for (;;) {
    Node t = tail;
    if (t == null) { // Must initialize
      if (compareAndSetHead(new Node()))
       tail = head;
    } else {
      node.prev = t;
      if (compareAndSetTail(t, node)) {
        t.next = node;
        return t;
      }
    }
  }
 }

从脉络上看，是一个经典for循环+CAS 自旋操作。你可以跟着看下代码执行的思路：

1）第一次for循环

首先t指向tail，tail由于是null，t刚开始肯定是null，进入第一个if。

接着通过CAS操作compareAndSetHead，将head指向了新建的一个Node，成功后将tail指向了head。

private final boolean compareAndSetHead(Node update) {
 return unsafe.compareAndSwapObject(this, headOffset, null, update);
}

所以会得到如下图所示结果：

2）第二次for循环

  private Node enq(final Node node) {
   for (;;) {
     Node t = tail;
     if (t == null) { // Must initialize
       if (compareAndSetHead(new Node()))
         tail = head;
     } else {
       node.prev = t;
       if (compareAndSetTail(t, node)) {
         t.next = node;
         return t;
       }
     }
   }
  }

此时ReentrantLock的tail和head已经指向了空的new Node()。

接着还是t=tail, t此时不为空了。走到了else逻辑，使用入参node节点的prev指向了t所指向的空Node。

之后通过CAS操作compareAndSetTail,将tail指向到入参node节点。

  private final boolean compareAndSetTail(Node expect, Node update) {
   return unsafe.compareAndSwapObject(this, tailOffset, expect, update);
  }

最后通过t的next也指向了入参node节点。

也就是如下图所示：

从上图，我们就可以看出来，线程2的node和空node连接起来，形成了一个双向链表。之前学习LinkedList你应该已经知道，双向链表也可以当做队列使用。所以这里你可以当做将node进行了入队操作。

这个其实就是AQS的本质，等待队列组件的作用。

当线程2进行了入队等待，这里你可以简化一下流程图，你可以得到如下的图：

加锁失败的时候如何借助AQS异步入队阻塞等待？

入队后，接着就结束了么？不是，还需要修改下线程2的状态，将他进行挂起，既然已经排上队了，就不要占用CPU资源了，是不是？

我们看下是如何做的：

  public final void acquire(int arg) {
   if (!tryAcquire(arg) &&
     acquireQueued(addWaiter(Node.EXCLUSIVE), arg))
     selfInterrupt();
  }

之前我们执行完了addWaiter,返回的节点是node，也就是线程2对应的等待节点，arg是1。接着进入了acquireQueued这个方法：

final boolean acquireQueued(final Node node, int arg) {
   boolean failed = true;
   try {
     boolean interrupted = false;
     for (;;) {
       final Node p = node.predecessor();
       if (p == head && tryAcquire(arg)) {
         setHead(node);
         p.next = null; // help GC
         failed = false;
         return interrupted;
       }

       if (shouldParkAfterFailedAcquire(p, node) &&
         parkAndCheckInterrupt())
         interrupted = true;
     }
   } finally {
     if (failed)
       cancelAcquire(node);
   }
  }

目前等待队列情况如下：

这个方法核心脉络，是一个无限for循环，当中有两个if。

接着我们看下细节：

1）第一次For循环：

首先上来使用一个辅助指针p，指向了node节点的前一个节点，node.predecessor其实就是p=node.prev。代码如下：

final Node predecessor() throws NullPointerException {
     Node p = prev;
     if (p == null)
       throw new NullPointerException();
     else
       return p;
   }

由于head等于p,就还是尝试获取一次锁，tryAcquire(arg)。这里假设线程1还没有释放锁，tryAcquire(arg)肯定还是会失败返回false，所以第一个if不成立。（如果获取成功，这个if其实会将线程2移出队列的）

接着执行第二个if判断，先进行了shouldParkAfterFailedAcquire方法调用，第一个参数传入p，就是空Node,第二参数传入node，就是线程2对应的node。

  private static boolean shouldParkAfterFailedAcquire(Node pred, Node node) {
   int ws = pred.waitStatus;
   if (ws == Node.SIGNAL)
     /*
      * This node has already set status asking a release
      * to signal it, so it can safely park.
      */
     return true;

   if (ws > 0) {
     /*
        * Predecessor was cancelled. Skip over predecessors and
      * indicate retry.
      */
     do {
       node.prev = pred = pred.prev;
     } while (pred.waitStatus > 0);
     pred.next = node;
   } else {
     /*
      * waitStatus must be 0 or PROPAGATE. Indicate that we
      * need a signal, but don't park yet. Caller will need to
      * retry to make sure it cannot acquire before parking.
      */
     compareAndSetWaitStatus(pred, ws, Node.SIGNAL);
   }
   return false;
  }

第一个参数传入p，就是空Node,第二参数传入node，就是线程2对应的node。

它们两个节点的waitStatus都是0。所以经过上面代码，会执行到最后一个else。

会通过CAS操作，将空Node的waitStatus状态(ws)从0改为Node.SIGNAL(-1)。如下图所示：

接着shouldParkAfterFailedAcquire就直接返回false，第一个条件false。就会直接进行下一次for循环了。

 final boolean acquireQueued(final Node node, int arg) {
  boolean failed = true;
  try {
    boolean interrupted = false;
    for (;;) {
      final Node p = node.predecessor();
      if (p == head && tryAcquire(arg)) {
        setHead(node);
        p.next = null; // help GC
        failed = false;
        return interrupted;
      }

      if (shouldParkAfterFailedAcquire(p, node) &&
        parkAndCheckInterrupt())
        interrupted = true;
    }
  } finally {
    if (failed)
      cancelAcquire(node);
  }
 }

2）第二次For循环

假设线程1还是没有释放锁，上面的for循环还是会进入如下方法，但是其实的pred也就是空Node的watiStatus已经被改成SIGNAL（-1）,所以之里会返回true。

private static boolean shouldParkAfterFailedAcquire(Node pred, Node node) {
   int ws = pred.waitStatus;
   if (ws == Node.SIGNAL)
     /*
      * This node has already set status asking a release
      * to signal it, so it can safely park.
      */
     return true;

   if (ws > 0) {
     /*
        * Predecessor was cancelled. Skip over predecessors and
      * indicate retry.
      */
     do {
       node.prev = pred = pred.prev;
     } while (pred.waitStatus > 0);
       pred.next = node;
     } else {

     /*
      * waitStatus must be 0 or PROPAGATE. Indicate that we
      * need a signal, but don't park yet. Caller will need to
      * retry to make sure it cannot acquire before parking.
      */
     compareAndSetWaitStatus(pred, ws, Node.SIGNAL);
   }
   return false;

  }

接着下面这个if第一个条件是ture会判断第二条件parkAndCheckInterrupt

  if (shouldParkAfterFailedAcquire(p, node) &&
         parkAndCheckInterrupt())
         interrupted = true;

parkAndCheckInterrupt这个方法从名字看叫做挂起并且检查线程是否被打断。代码如下

  private final boolean parkAndCheckInterrupt() {
   LockSupport.park(this);
   return Thread.interrupted();
  }

可以看到他核心调用了一个工具类LockSupport.park(this);

 public static void park(Object blocker) {
  Thread t = Thread.currentThread();
  setBlocker(t, blocker);
  UNSAFE.park(false, 0L);
  setBlocker(t, null);
 }

这个底层是通过UNSAFE的C++代码实现的，我们就不去看了。你只要知道，这个park操作会将线程挂起，进入等待状态就可以了。还记得之前将线程的状态图么？

park操作会将线程挂起，进入Waiting等待状态。也就是说线程2加锁失败最终就是入队并且等待。

今天这一节，到这里就把AQS中入队的逻辑给大家讲清楚了。线程获取锁失败如何入队？如何挂起的？相信你都很清楚了。你可以自己用第三个线程尝试加锁失败彻底图解AQS队列等待机制试试。最后学完，如果你可以画出这个图，就说嘛你真正明白了AQS的基本原理了。

小结&思考

虽然这个入队逻辑看着比较复杂，但其实大家可以抽象出这个队列的设计是基于：CAS操作+Node状态+线程标记控制就可以了。

可以多思考下关键思想和关键点，不用太纠结细节。比如多思考下为啥设计了状态，是为了单独使用Condition吗？还是。。。。

这些思考才是最重要的！

下一节，我们看下如果线程1释放了锁，如何唤醒队列中元素的。唤醒的时候如果有本地线程来加锁，还能插队！？所以下一节也会给大家介绍下什么是公平和非公平锁。

本文由博客群发一文多发等运营工具平台 OpenWrite 发布

posted @ 2021-10-29 19:45 _繁茂阅读(157) 评论(0) 收藏举报

刷新页面返回顶部

JDK成长记19：ReenranctLock（2）加锁入队的AQS底层原理

直接从JDK源码层面理解AQS的另一个线程也来加锁的入队逻辑

直接从JDK源码层面理解AQS的另一个线程也来加锁的入队逻辑

AQS的本质：为啥叫做异步队列同步器？

AQS的本质：为啥叫做异步队列同步器？

加锁失败的时候如何借助AQS异步入队阻塞等待？

加锁失败的时候如何借助AQS异步入队阻塞等待？

小结&思考

小结&思考

公告