Java并发编程艺术系列-二、Java并发机制底层原理

二、Java并发机制底层原理

  • volatile
  • synchronized
  • 原子操作

2.1 volatile原理与应用

2.1.1 特点

  • 轻量级的 synchronized
  • 共享变量的“可见性”(定义):如果一个字段被声明成volatile,Java线程内存模型确保所有线程看到这个变量的值是一致的
  • 不会引起线程上下文的切换和调度:使用恰当可比synchronized的使用和执行成本更低
  • 可见性,有序性,禁止指令重排

2.1.2 如何保证可见性

2.1.2.1 术语

image-20210520113955114

2.1.2.2 可见性实现原理

instance = new Singleton(); // instance是volatile变量
// 转变的汇编代码
0x01a3de1d: movb $0×0,0×1104800(%esi);0x01a3de24: lock addl $0×0,(%esp);
  • Lock指令

    锁总线:独占共享内存

    锁缓存:减少开销(新处理器的处理方案)

    • 引起处理器缓存回写到内存
      • 缓存一致性:阻止同时修改两上以上处理器缓存的内存区域数据
    • 回写内存导致其他处理器缓存失效
      • MESI(修改、独占、共享、失效)控制协议保证缓存一致性
      • 处理器嗅探:保证它的内部缓存、系统内存和其他处理器的缓存的数据在总线上保持一致
      • 缓存行失效,下次访问时强制缓存行填充。

2.1.3 追加字节优化

Java并发编程大师Doug lea在JDK 7的并发包里新增一个队列集合类Linked-TransferQueue

2.1.3.1 Linked-TransferQueue

//队列中的头部节点
private transient final PaddedAtomicReference<QNode> head;
//队列中的尾部节点
private transient final PaddedAtomicReference<QNode> tail;

static final class PaddedAtomicReference<T> extends AtomicReference T> {
    // 使用很多4个字节的引用追加到64个字节 
    Object p0, p1, p2, p3, p4, p5, p6, p7, p8, p9, pa, pb, pc, pd, pe;
    PaddedAtomicReference(T r) {
        super(r);
    }
}

public class AtomicReference<V> implements java.io.Serializable {
    private volatile V value;
    // 省略其他代码 
}

2.1.3.2 原理

Doug lea使用追加到64字节的方式来填满高速缓冲区的缓存行,避免头节点和尾节点加载到同一个缓存行,使头、尾节点在修改时不会互相锁定

2.2 synchronized原理与应用

synchronized用的锁是存在Java对象头里的

  • 数组类型对象-3个字宽(Word)存储对象头
  • 非数组类型对象用2字宽存储对象头,32位虚拟机一字宽4字节,即8字节64位

2.2.1 java对象头

image-20210520173544389

  • mark word状态变化表

    image-20210520174013162

2.2.2 锁升级

2.2.2.1 偏向锁

  • 为什么

    研究发现:大多数情况下,锁不仅不存在多线程竞争,而且总是由同一线程多次获得,为了让线程获得锁的代价更低而引入了偏向锁

  • 怎么做的

    线程第一次获取锁时,会在对象头和栈帧中的锁记录里存储锁偏向的线程ID,

    以后该线程在进入和退出同步块时不需要进行CAS操作来加锁和解锁,只需简单地测试一下对象头的Mark Word里是否存储着指向当前线程的偏向锁

    测试成功-获得锁,失败则判断是否设置偏向锁标志,设置则尝试使用CAS设置对象头偏向锁指向当前线程;未设置则使用CAS竞争锁

    • 锁撤销:竞争出现则会引起持有偏向锁的线程撤销锁
    • 延迟激活:偏向锁默认启用,应用程序启动几秒钟之后才激活,延迟参数设置为0可关闭延迟:-XX:BiasedLockingStartupDelay=0
    • 关闭偏向锁:确定应用程序里所有的锁通常情况下处于竞争状态,可使用关闭:-XX:-UseBiasedLocking=false

2.2.2.2 轻量级锁

  • 加锁:线程在执行同步块之前,JVM会先在当前线程的栈桢中创建用于存储锁记录的空间,并将对象头中的Mark Word复制到锁记录中,官方称为Displaced Mark Word。然后线程尝试使用CAS将对象头中的Mark Word替换为指向锁记录的指针。如果成功,当前线程获得锁,如果失败,表示其他线程竞争锁,当前线程便尝试使用自旋来获取锁。

  • 解锁:轻量级解锁时,会使用原子的CAS操作将Displaced Mark Word替换回到对象头,如果成功,则表示没有竞争发生。如果失败,表示当前锁存在竞争,锁就会膨胀成重量级锁。

2.2.2.3 锁比较

image-20210521170617239

2.3 原子操作

原子操作(atomic operation)意为“不可被中断的一个或一系列操作”

2.3.1 术语

image-20210521171623751

2.3.2 处理器如何实现

2.3.2.1 使用总线锁保证原子性

总线锁就是使用处理器提供的一个LOCK#信号,当一个处理器在总线上输出此信号时,其他处理器的请求将被阻塞住,那么该处理器可以独占共享内存

2.3.2.2 使用缓存锁保证原子性

  • 总线锁的缺点:在同一时刻,我们只需保证对某个内存地址的操作是原子性即可,但总线锁定把CPU和内存之间的通信锁住了,这使得锁定期间,其他处理器不能操作其他内存地址的数据,所以总线锁定的开销比较大

  • 实现原理:目前处理器在某些场合下使用缓存锁定代替总线锁定来进行优化

    所谓“缓存锁定”是指内存区域如果被缓存在处理器的缓存行中,并且在Lock操作期间被锁定,那么当它执行锁操作回写到内存时,处理器不在总线上声言LOCK#信号,而是修改内部的内存地址,并允许它的缓存一致性机制来保证操作的原子性,因为缓存一致性机制会阻止同时修改由两个以上处理器缓存的内存区域数据,当其他处理器回写已被锁定的缓存行的数据时,会使缓存行无效。

  • 例外:不会使用缓存锁定的情况

    • 当操作的数据不能被缓存在处理器内部,或操作的数据跨多个缓存行(cache line)时,则处理器会调用总线锁定
    • 有些处理器不支持缓存锁定。对于Intel 486和Pentium处理器,就算锁定的内存区域在处理器的缓存行中也会调用总线锁定

2.3.3 Java中的原子操作

2.3.3.1 使用循环CAS实现原子操作

JVM中的CAS操作正是利用了处理器提供的CMPXCHG指令实现的。自旋CAS实现的基本思路就是循环进行CAS操作直到成功为止

/* 使用CAS实现线程安全计数器 */
private void safeCount() {
    for (; ; ) {
        int i = atomicI.get();
        boolean suc = atomicI.compareAndSet(i, ++i);
        if (suc) {
            break;
        }
    }
}
  • 三大问题

    • ABA问题

      • A->B->A

      • 解决思路就是使用版本号。在变量前面追加上版本号,每次变量更新的时候把版本号加1,那么A→B→A就会变成1A→2B→3A

      • JDK1.5提供类AtomicStampedReference来解决ABA问题

        此类的compareAndSet方法的作用是首先检查当前引用是否等于预期引用,并且检查当前标志是否等于预期标志,如果全部相等,则以原子方式将该引用和该标志的值设置为给定的更新值。

        public boolean compareAndSet(
            V expectedReference, // 预期引用
            V newReference, // 更新后的引用 
            int expectedStamp, // 预期标志
            int newStamp // 更新后的标志 
        )
        
    • 循环时间长开销大:自旋CAS如果长时间不成功,会给CPU带来非常大的执行开销

    • 只能保证一个共享变量的原子操作

      JDK1.5提供了AtomicReference类来保证引用对象之间的原子性,就可以把多个变量放在一个对象里来进行CAS操作

posted @ 2021-05-26 22:53  杨海星  阅读(63)  评论(0编辑  收藏  举报