volatile的理解
学习地址:https://www.bilibili.com/video/BV18b411M7xz?p=2
参考《深入理解Java虚拟机:JVM高级特性与最佳实践(第3版) 周志明》
JMM
-
JMM(Java内存模型Java Memory Model,简称JMM)本身是一种抽象的概念并不真实存在,它描述的是一组规则或规范通过规范定制了程序中各个变量(包括实例字段,静态字段和构成数组对象的元素)的访问方式。
-
JMM关于同步规定:
-
线程解锁前,必须把共享变量的值刷新回主内存
-
线程加锁前,必须读取主内存的最新值到自己的工作内存
-
加锁解锁是同一把锁
-
-
由于JVM运行程序的实体是线程,而每个线程创建时JVM都会为其创建一个工作内存(有些地方成为栈空间),工作内存是每个线程的私有数据区域,而Java内存模型中规定所有变量都存储在主内存,主内存是共享内存区域,所有线程都可访问,但线程对变量的操作(读取赋值等)必须在工作内存中进行,首先要将变量从主内存拷贝到自己的工作空间,然后对变量进行操作,操作完成再将变量写回主内存,不能直接操作主内存中的变量,各个线程中的工作内存储存着主内存中的变量副本拷贝,因此不同的线程无法访问对方的工作内存,线程间的通讯(传值) 必须通过主内存来完成,其简要访问过程如下图:
可见性
可见性就是指当一个线程修改了共享变量的值时,其他线程能够立即得知这个修改。
Java内存模型是通过在变量修改后将新值同步回主内存,在变量读取前从主内存刷新变量值这种依赖主内存作为传递媒介的方式来实现可见性的,无论是普通变量还是volatile变量都是如此。普通变量与volatile变量的区别是,volatile的特殊规则保证了新值能立即同步到主内存,以及每次使用前立即从主内存刷新。因此我们可以说volatile保证了多线程操作时变量的可见性,而普通变量则不能保证这一点。除了volatile之外,Java还有两个关键字能实现可见性,它们是synchronized和final。
通过前面对JMM的介绍,我们知道各个线程对主内存中共享变量的操作都是各个线程各自拷贝到自己的工作内存操作后再写回主内存中的。
这就可能存在一个线程AAA修改了共享变量X的值还未写回主内存中时 ,另外一个线程BBB又对内存中的一个共享变量X进行操作,但此时A线程工作内存中的共享比那里X对线程B来说并不不可见。这种工作内存与主内存同步延迟现象就造成了可见性问题。
原子性
由Java内存模型来直接保证的原子性变量操作包括read、load、assign、use、store和write这六个,我们大致可以认为,基本数据类型的访问、读写都是具备原子性的(例外就是long和double的非原子性协定,读者只要知道这件事情就可以了,无须太过在意这些几乎不会发生的例外情况)。
如果应用场景需要一个更大范围的原子性保证(经常会遇到),Java内存模型还提供了lock和unlock操作来满足这种需求,尽管虚拟机未把lock和unlock操作直接开放给用户使用,但是却提供了更高层次的字节码指令monitorenter和monitorexit来隐式地使用这两个操作。这两个字节码指令反映到Java代码中就是同步块——synchronized关键字,因此在synchronized块之间的操作也具备原子性。
有序性
Java程序中天然的有序性可以总结为一句话:如果在本线程内观察,所有的操作都是有序的;如果在一个线程中观察另一个线程,所有的操作都是无序的。前半句是指“线程内似表现为串行的语义”(Within-Thread As-If-Serial Semantics),后半句是指“指令重排序”现象和“工作内存与主内存同步延迟”现象。
Java语言提供了volatile和synchronized两个关键字来保证线程之间操作的有序性,volatile关键字本身就包含了禁止指令重排序的语义,而synchronized则是由“一个变量在同一个时刻只允许一条线程对其进行lock操作”这条规则获得的,这个规则决定了持有同一个锁的两个同步块只能串行地进入。
重排1
public void mySort(){
int x=11;//语句1
int y=12;//语句2
x=x+5;//语句3
y=x*x;//语句4
}
1234
2134
1324
问题:
请问语句4 可以重排后变成第一条码?
存在数据的依赖性 没办法排到第一个
重排2
int a ,b ,x,y=0;
线程1 | 线程二 |
---|---|
x=a; | y=b; |
b=1; | a=2; |
结果 | x=0 y=0 |
如果编译器对这段代码进行执行重排优化后,可能出现下列情况:
线程1 | 线程二 |
---|---|
b=1; | a=2; |
x=a; | y=b; |
结果 | x=2 y=1 |
这也就说明在多线程环境下,由于编译器优化重排的存在,两个线程使用的变量能否保持一致是无法确定的。
线程操作资源类,线程1访问method1,线程2访问method2,正常情况顺序执行,a=6
多线程下假设出现了指令重排,语句2在语句1之前,当执行完flag=true后,另一个线程马上执行method2,a=5。
小结
并发中三种重要的特性,读者是否发现synchronized关键字在需要这三种特性的时候都可以作为其中一种的解决方案?看起来很“万能”吧?的确,绝大部分并发控制操作都能使用synchronized来完成。synchronized的“万能”也间接造就了它被程序员滥用的局面,越“万能”的并发控制,通常会伴随着越大的性能影响。
volatile
volatile是Java虚拟机提供的轻量级的同步机制
- 保证可见性
- 不保证原子性
- 禁止指令重排
volatile可见性和不保证原子性
import java.util.concurrent.atomic.AtomicInteger;
/**
* 1 验证volatile的可见性
* 1.1 加入int number=0,number变量之前根本没有添加volatile关键字修饰,没有可见性
* 1.2 添加了volatile,可以解决可见性问题
* <p>
* 2 验证volatile不保证原子性
* 2.1 原子性是不可分割,完整性,也即某个线程正在做某个具体业务时,中间不可以被加塞或者分割。
* 需要整体完成,要么同时成功,要么同时失败。
* <p>
* 2.2 volatile不可以保证原子性演示
* <p>
* 2.3 如何解决原子性
* 加sync
* 使用我们的JUC下AtomicInteger
*/
public class VolatileDemo {
public static void main(String[] args) {
MyData myData = new MyData();
System.out.println("************可见性************");
/*new Thread(() -> {
System.out.println(Thread.currentThread().getName() + "\t come in");
try {
TimeUnit.SECONDS.sleep(3);
} catch (InterruptedException e) {
e.printStackTrace();
}
myData.addTo60();
System.out.println(Thread.currentThread().getName() + "\t updated number value: " + myData.number);
}, "AAA").start();
//第二个线程就是main线程
while (myData.number == 0) {
//main线程就一直在这里等待循环,直到number值不再等于0
}
System.out.println(Thread.currentThread().getName() + "\t updated number value: " + myData.number);*/
System.out.println("*****************************");
for (int i = 1; i <= 20; i++) {
new Thread(() -> {
for (int j = 1; j <= 1000; j++) {
myData.addPlusPlus();
myData.addMyAtommic();
}
}, String.valueOf(i)).start();
}
//需要等待上述20个线程都计算完成后,再用main线程去的最终的结果是多少?
/*try {
TimeUnit.SECONDS.sleep(5);
} catch (InterruptedException e) {
e.printStackTrace();
}*/
while (Thread.activeCount() > 2) {
Thread.yield();
}
System.out.println(Thread.currentThread().getName() + "\t finnally number value: " + myData.number);//19817
System.out.println(Thread.currentThread().getName() + "\t finnally number value: " + myData.atomicInteger);//20000
}
}
class MyData {
/**
* AAA come in
* AAA updated number value: 60
* 程序没有终止
*/
// int number = 0;
/**
* AAA come in
* AAA updated number value: 60
* main updated number value: 60
*/
volatile int number = 0;
public void addTo60() {
this.number = 60;
}
//请注意,此时number前面是存在volatile关键字修饰的
public void addPlusPlus() {
number++;
}
AtomicInteger atomicInteger = new AtomicInteger();
public void addMyAtommic() {
atomicInteger.getAndIncrement();
}
}
number++原子操作
禁止指令重排
volatile实现禁止指令重排优化,从而避免多线程环境下程序出现乱序执行的现象
先了解一个概念,内存屏障(Memory Barrier)又称内存栅栏,是一个CPU指令,它的作用有两个:
-
一是保证特定操作的执行顺序,
-
二是保证某些变量的内存可见性(利用该特性实现volatile的内存可见性)。
由于编译器和处理器都能执行指令重排优化。如果在指令间插入一条Memory Barrier则会告诉编译器和CPU,不管什么指令都不能和这条Memory Barrier指令重排序,也就是说通过插入内存屏障禁止在内存屏障前后的指令执行重排序优化。内存屏障另外一个作用是强制刷出各种CPU的缓存数据,因此任何CPU上的线程都能读取到这些数据的最新版本。
volatile应用
单例模式DCL代码
public class SingletonDemo {
// private static SingletonDemo instance = null;
private static volatile SingletonDemo instance = null;//禁止指令重排
private SingletonDemo() {
System.out.println(Thread.currentThread().getName() + "\t 我是构造函数SingletonDemo()");
}
//DCL(Double Check Lock双端检锁机制)
public static SingletonDemo getInstance() {
if (instance == null) {
synchronized (SingletonDemo.class) {
if (instance == null) {
instance = new SingletonDemo();
}
}
}
return instance;
}
public static void main(String[] args) {
// 并发多线程后,情况发生了很大的变化
for (int i = 1; i <= 10; i++) {
new Thread(() -> {
SingletonDemo.getInstance();
}, String.valueOf(i)).start();
}
}
}
单理模式volatile分析
DCL(双端检锁) 机制不一定线程安全,原因是有指令重排的存在,加入volatile可以禁止指令重排。
原因在于某一个线程在执行到第一次检测,读取到的instance不为null时,instance的引用对象可能没有完成初始化。
instance=new SingletonDem(); 可以分为以下3步完成(伪代码)
memory=allocate();//1.分配对象内存空间
instance(memory);//2.初始化对象
instance=memory;//3.设置instance的指向刚分配的内存地址,此时instance!=null
步骤2和步骤3不存在数据依赖关系,而且无论重排前还是重排后程序执行的结果在单线程中并没有改变,因此这种重排优化是允许的。
memory=allocate();//1.分配对象内存空间
instance=memory;//3.设置instance的指向刚分配的内存地址,此时instance!=null 但对象还没有初始化完。
instance(memory);//2.初始化对象
但是指令重排只会保证串行语义的执行一致性(单线程) 并不会关心多线程间的语义一致性。
所以当一条线程访问instance不为null时,由于instance实例未必完成初始化,也就造成了线程安全问题。