Java并发编程实战2-线程安全

1. 定义

一个类是线程安全的,是指在被多个线程访问时,类可以持续进行正确的行为。

2. WHY

我们想要的是线程安全的程序,为什么在线程安全的开始讲线程安全的类呢?

编写线程安全的代码,本质上就是管理对状态的访问,而且通常是共享的、可变的状态

我们讨论的的线程安全性,看起来好像是关于代码的,但是我们真正要做的,是在不可控制的并发访问中保护数据

当多个线程访问一个类时,如果不用考虑这些线程在运行时环境下的调度和交替执行,并且不需要额外的同步及在调用方不必作其它的协调,这个类的行为仍然是正确的,那么称这个类是线程安全的。

对与线程安全类的实例进行顺序或并发的一系列操作,都不会导致实例处于无效状态。

3. 无状态对象是线程安全的

无状态对象:它不包含域也没有引用其他类的域。

例如:

public class MathAdd {
	public int add(int a, int b){
		return a + b;
	}
}

对于MathAdd的实例来说,它只有一个计算两个int数值的的和的add()方法,每个执行线程在运行时,本地变量存储在线程栈中,只有执行线程能够访问,那么无论这个示例被多少个线程并发执行,不同的线程之间并不会相互影响,原因就是:两个线程不共享状态,它们如同在访问不同的实例。

4. 原子性

仍然使用MathAdd来说,假设我们现在需要统计一下,一个MathAdd类的实例被使用的次数,修改后的类如下:

public class MathAdd {

	private long count = 0;

	public long getCount(){
		return count;
	}

	public int add(int a, int b){
		++count;
		return a + b;
	}

}

此时,MathAdd的实例不再是无状态的对象了,因为其中增加了一个count属性,而多个线程之间又要在add()方法中对count属性进行操作,因此count属性被多个线程共享并操作。

那么这个对象是线程安全吗?不是,因为在add()方法中,有 ++count; 语句,正是这个语句导致对象不是线程安全的。++count; 的执行过程是:先获取当前count的值,然后对当前值加1,将新值写回count,也就是有三个操作,不是一个原子操作

我自己给原子操作下了一个定义:一个操作是不可分割的,就是原子操作。

5. 竞争条件

当计算的正确性依赖于运行时相关的时序或者多线程的交替时,就会产生竞争条件。也就是说,计算的正确性依赖时序,会产生竞争条件。

通过代码来进一步理解:

public class LazyInitRace {
	private ExpensiveObject instance = null;

	public ExpensiveObject getInstance() {
		if(null == instance){
			instance = new ExpensiveObject();
		}
		return instance;
	}
}

上面的代码是常用的方法惰性初始化,由于某个对象的初始化代价比较昂贵(占用时间和资源),因此延迟对象的初始化,直到程序真正使用它,同时确保它只初始化一次。

上述代码存在竞争条件:当两个线程操作同一个LazyInitRace对象时,A线程检查instace为空,于是new一个对象;这时,B线程也检查instance是否为null,如果A已经成功new了一个对象,那么B线程就直接返回A线程new的对象;但是,也存在这种情况,A正在new对象,但是没有完成,此时instance还是null,于是B线程也来new对象了,这时就存在两个instance对象了,可能直接导致后面所有的程序都是在两个不同的instance对象上操作,导致程序出错。

6. 复合操作

在MathAdd类和LazyInitRace类中,都是由于某个语句或某个语句块不是原子操作:++count;不是一个原子操作;if(null == instance) { instance = new ExpensiveObject(); }更是明显的非原子操作,也就是复合操作,但是我们在运行程序时,只有满足是原子操作操作时,才能保证运行结果的正确性。

正是由于多线程程序会用到复合操作的中间结果,导致了对象不是线程安全。对于多线程共用的对象来说,中间结果可能是正确的,也可能是不正确,任何一个线程都不能依赖于复合操作的中间结果。

俗语说“苍蝇不叮无缝的蛋”,对于多线程来说,Bug专叮依赖于复合操作中间结果的多线程,也可以说Bug专叮依赖于时序的多线程

7. 内部锁

通过前面的学习,我们发现导致多线程出错的原因,就是对象的某些操作不是原子操作,出现了中间结果,进而导致运行结果错误。因此,Java提供了强制原子性的内置锁机制:syschronized块,语法如下:

synchronized(loack) {
    //访问或修改被锁保护的共享状态
}

从synchronized的语法上可以看出,它有两部分:锁对象的引用,以及这个锁保护的代码块。

执行线程进入synchronized块前,需要获得锁,否则必须等待或阻塞;无论通过正常控制路径退出,还是从块中抛出异常,线程都会释放锁。以此,保证了原子性。实例代码:

public class LazyInitRace {
	private ExpensiveObject instance = null;

	public synchronized ExpensiveObject getInstance() {
		if(null == instance){
			instance = new ExpensiveObject();
		}
		return instance;
	}
}

注意一点,如果用synchronized修饰方法,那么锁的对象会有不同:

(1) 当方法不是静态方法时,锁是该方法所在的对象本身;

(2) 当方法是静态方法时,锁是该方法所在的class的class对象。

每个Java对象都可以隐式地扮演一个用于同步的锁的角色,这些内置的锁被称为内部锁

8. 可重入性

当一个线程获得了锁之后,当该线程再次请求获得该锁时,是可以再次成功获得该锁,就是可重入。从逻辑上来说,这是合理的,如果不满足可重入,会出现什么情况呢:

public class Parent {

	public synchronized void doSomething(){
		System.out.println("doSomething in Parent");
	}

}

public class Child extends Parent {

	public synchronized void doSomething(){
		System.out.println("doSomething in Child");
		super.doSomething();
	}

}

如果锁不满足可重入性,那么当在Child中调用doSomething时,执行到了super.doSomething()时,永远无法进入,造成死锁。

9. 用锁来保护状态

通过对对象内部的可变状态变量加锁,可以保证对状态变量的操作是原子的,也就保护了状态。

只要保证多线程访问时,每次都用同一个锁来保护变量,就能避免竞争条件。因此,这个锁是否与对象有关都没有关系。但是,为了便利,每个对象都有一个内部锁,所以不需要显式创建锁对象。

对于每一个设计多个变量的不变约束,需要同一个锁来保护其所有的变量。

10. 性能

synchronized块是好的,可以保证操作是原子的。但是,如果将整个方法都加上synchronized的话,那么这个方式就是串行的了,失去了多线程的好处。因此,synchronized块的大小要根据需要设置,甚至可以将不要保证原子操作的两部分代码分别加上synchronized,从而保证多线程的性能。示例代码:

public class Test {

	public void doSomething(){

		//代码1,不需要保证同步

		synchronized(this){
			//代码2,保证同步
		}

		//代码3,不需要保证同步

		synchronized(this){
			//代码4,需要保证同步,但是跟代码2中没有关联
		}

	}

}
posted @ 2017-05-26 14:40  Acode  阅读(229)  评论(0编辑  收藏  举报
您是本站第访问量位访问者!