多线程下race condition问题

       这个问题的讨论来自内部的一个关于“多线程环境下使用Hashmap的安全问题”的讨论,HashMap多线程的问题之前已经提过一次,见之前的blog.本篇文章主要讨论多线程下race condition的问题。以下内容部分引用自内部邮件:

错误代码:

定义成员变量
private static Map cachedMap = new HashMap(7000);
private static Boolean firstInvoke = true;
程序是设想在第一次开始对该map变量进行初始化
线程1:
Public Object getMyValue(){
If(firstInvoke){
While(i<7000){
…………
cachedMap.put("new","newValue");
i++;
}
firstInvoke = false;
}
}

线程2:
在线程1对cachedMap对象put的时候,线程2从这个cachedMap中取值
cachedMap.get("new");

错误分析   

       单步Debug是没问题,但代码在多线程情况下工作会出现线程安全。 Hashmap不是读写线程安全的,只有全部只读才是线程安全的,Hashmap在被并发读写使用的时候会出现线程安全问题,一般理解的线程安全问题导致的是数据错误。 而Hashmap多线程同时读写操作时,可能使程序挂起。

以下引用自http://sdh5724.javaeye.com/blog/619130

       分析: 我们知道Hashmap在被并发读写使用的时候, 会抛出ConcurrentModificationException这个异常, 但是JDK文档明确指出, 这个异常抛出是属于 fail-fast 的一个设计方法, 目的是为了开发者能及早的意识到线程安全问题发生。 但是, 这个fail-fast不是一定会发生, 而是可能会发生的行为。 因此, 在一个不确定状态下的下,jvm线程发生持续100%cpu行为是比较容易理解了(for (Entry<K,V> e = table[i]; e != null; e = e.next), 目前只能估计是这个代码进入死循环的状态,还不能非常明确)。

“正确用法”

注意更改HashMap中的内容时是否存在同时并发线程读的情况,如果有, 需要对读写的入口做同步. 如果知道要在多线程情况下读写Map, 建议使用线程安全的ConcurrentHashMap实现代替HashMap。ConcurrentHashMap 可以在不损失线程安全的同时提供很好的并发性。
代码如下:

private static Map cacheMap = new ConcurrentHashMap(7000);
private static Boolean firstInvoke = true;
程序是设想在第一次开始对该map变量进行初始化
线程1:
Public Object getMyValue(){
If(firstInvoke){
While(i<7000){
…………
cachedMap.put("new","newValue");
i++;
}
firstInvoke = false;
}
}

线程2:
在线程1对cachedMap对象put的时候,线程2从这个cachedMap中取值
cachedMap.get("new");

上述解决方案的race condition问题:

这个HashMap不当使用的问题很经典。很多时候我们用“单线程”思维习惯去写代码,不知不觉就忘记了运行时的多线程场景。

其实,我觉得下面的例子中还是有隐含的race condition问题的,那就是在这个if(firstInvoke) then load data and firstInvoke=false这个逻辑中。

即:If(firstInvoke){…  //ß 这里可能会导致多条线程同时进入,导致多次load data

通常我们用一个boolean变量来实现lazy操作, 那么在多线程环境下,要记得使用synchronize关键词 或者 采用volatile类型变量+CAS操作,确保变量被每条线程都能正确的读取和写入。

1. 保险的做法:(在最新JVM中,这种方式是最安全,最可读,性价比最高的,如果JVM支持锁逃逸即Biased Locking,性能也会非常好)

Synchronized(lock){
If(firstInvoke){
Then load data…
firstInvoke = false
}
}

2. 或者,用volatile变量+DCL

Private volatile boolean firstInvoke = true;

If(firstInvoke){

Synchronized(lock){

If(firstInvoke){

Then load data …

firstInvoke = false;

}

}

}

3. SMP友好,但是偷懒的做法,用AtomicBoolean,里面用到了CompareAndSet操作。(volatile只保证变量可见性,Spinning CAS保证操作原子性)

Private AtomicBoolean firstInvoke = new AtomicBoolean(true);

If(firstInvoke.getAndSet(false)){ // cas spinning inside the AtomicBoolean::getAndSet() method

Then load data…

}

4. 最后,最复杂,但是同时满足SMP友好,及性能最佳的:

private AtomicBoolean firstInvoke = new AtomicBoolean(true);

for(;;){

Boolean current = firstInvoke.get();

If(!current){ // the most likely condition branch, see http://pt.alibaba-inc.com/wp/dev_related/optimization_363/likely-unlikely.html

Break;

}

If(firstInvoke.compareAndSet(current,false){

Then load data…

Break;

}

}

在××××代码中,为了确保SMP状态下性能最优,我们在某一些关键地方也用到了上面的CAS+spinning的技巧。

我们也许并不会时时刻刻用到“回字的四种写法”,但是搞清楚JVM内存可见性和操作原子性的基本概念还是必须的,这也是确保写出线程安全代码的前提条件)。

 

参考资料:

http://sdh5724.javaeye.com/blog/619130

http://www.tech-faq.com/race-condition.html

《 The Art of Multiprocessor Programming》 http://book.douban.com/subject/3024605/

race condition by @Shawn

 

相关资料:

Java轻量级锁原理详解(Lightweight Locking)

Java偏向锁实现原理(Biased Locking)

深入理解DCL(双检锁)的安全性

posted @ 2011-03-29 17:45  redcreen  阅读(7432)  评论(0编辑  收藏  举报