Java并发专题(二)线程安全

前言

  随着时代的发展,CPU核数的增加和计算速度的提升,串行化的任务执行显然是对资源的极大浪费,掌握多线程是每个程序员必须掌握的技巧。但是同时多线程也是一把双刃剑,带来了共享资源安全的隐患。在本节会介绍线程安全是什么、最基本的独占悲观式来保证线程安全的介绍。随着章节步步深入。

 

1.1 什么是线程安全?

1.1.1 初识线程安全的尴尬

  本人是17年毕业的,刚进第一家公司的时候没有开发经验,对接第三方支付公司外部API压测的时候碰到一个问题:对方要求我5次/s,一共发300s的付款请求。其中一个请求的id,保证当日每一次唯一。我请求的id从1开始递增,但是总是也达不到300*5=1500。也闹出了很尴尬的笑话。这是我第一次接触多线程。为了简化问题,例子如下:2个线程对一个数字递增加2000次,看看是否最后是2000。

/**
 * 多线程递增某一个数字的测试类。
 *
 * @author GrimMjx
 */
public class UnsafeAdd {

    private int i;

    public int getNext() {
        return i++;
    }

    public static void main(String[] args) throws InterruptedException {
        UnsafeAdd multiAdd = new UnsafeAdd();

        Thread thread1 = new Thread(() -> {
            for (int i = 0; i < 1000; i++) {
                multiAdd.getNext();
            }
        });

        Thread thread2 = new Thread(() -> {
            for (int i = 0; i < 1000; i++) {
                multiAdd.getNext();
            }
        });

        thread1.start();
        thread2.start();

        //请结合上一章节体会为何写下面2行
        thread1.join();
        thread2.join();

        System.out.println(multiAdd.i);
    }
}

  运行的结果99%都不是自己想要的结果,说明这边出现了线程安全的问题。除了这个例子相信很多同学都会听到类似这种话"HashMap不是线程安全的"、"不可变对象一定是线程安全的"等等。这些都是在说线程安全方面的话题,之后的源码分析专题会分析为什么HashMap不是线程安全的,取而代之的ConcurrentHashMap如何保证线程安全的?同时JDK6引入ConsurrentSkipListMap和ConcurrentSkipListSet分别作为同步的SortedMap和SortedSet的并发替代品,还有用synchronizedxxx()方法包装的Map。

1.1.2 线程安全的概念

  对于线程安全的概念,参考《Java Concurrency in Practice》中的一句对线程安全的定义:当多个线程访问某个类时,这个类始终都能表现出正确的行为,那么这个类就是线程安全的。

1.1.3 Race condition(竞态条件)

  现在我们来分析一下上面的数据不一致问题,这种情况成为竞态条件,为什么会出现这个问题?UnsafeAdd的问题在于,线程的执行是由CPU时间片轮询调度的,如果执行的时机不对,那么可能在调用getNext()方法的时候得到一样的值、或者某些值被忽略等。主要是i++;看起来是一个原子操作,但是它包含了3个独立的操作:读取i,将i+1,并将计算结果写入i。简单画一张图,如下:

  

  线程A和线程B可能都读到i的变量为10,所以可能导致重复的情况,造成达不到2000的效果。

 

1.2 初识保证线程安全的基本方法

1.2.1 synchronized关键字

  什么是synchronized?引入一段来自JDK官网对synchronized关键字比较权威的解释:Synchronized keyword enable a simple strategy for preventing thread interference and memory consistency errors: if an object is visible to more than one thread, all reads or writes to that object's variables are done through synchronized methods. 如果一个对象对多线程是可见的,那么对改对象的读写操作都将通过同步的方式进行。网上对他的讲解千千万,很多都是一样的。接下来讲一下我对他的具体表现:

  • synchronized关键字用到的是monitor enter和monitor exit两个JVM指令(请用javap命令自行研究),且遵循happens-before规则。能保证在monitor enter,获取到锁之前必须从主内存获取数据,而不是线程的本地内存。在monitor exit之后变量会刷新到主内存。(这里和上面的图都涉及到JMM模型,这是并发的基础,后面章节会详细介绍
  • “synchronized是一把锁”,这种理解是不严谨的。准确的来说是某线程获取了对象的monitor锁,在没有释放该锁之前,其他线程在同一时刻无法获取该锁
  • synchronized可以用于对代码块或者方法进行修饰,不能对变量进行修饰

  如果要解决之前的问题,那么在getNext()方法上加上synchronized关键字就可以解决了问题。原因就是上面提到的,当某个线程获取了monitor锁,那么其他线程是无法获取锁的。也就是说其他线程都无法执行该方法,直到其他线程放弃该锁。每一个内置锁都有且只能有一个相关联的条件队列(这里的设计是否好呢?),当一个线程获取锁进行操作的时候,其他线程都在这个队列里等待该锁。那么解决掉问题也了解最基本的保证线程安全的方法之后,我们来看一下JDK对synchronized的优化以及synchronized的弊端。

1.2.2 synchronized的优化

  • 自旋锁
    • 自旋锁在JDK1.4引入,在JDK1.6默认开启。自旋锁到底是什么呢?之前我们说的互斥锁对性能的影响很大,Java线程是映射到操作系统的原生线程上的,如果要阻塞或者唤醒一个线程就需要操作系统的帮助,因此状态转换需要花费很多CPU时间。因为锁定的状态一般只会持续很短很短的时间,为了这段时间去挂起然后再唤醒是很不值得的。如果服务器有多个处理器,我们就可以让后面的线程稍微等等,但是并不放弃CPU执行时间,这个稍微等等的过程就是自旋。
    • 自旋锁和阻塞锁很大的区别就是是否要放弃CPU执行时间
  • 锁消除
    • 锁消除是JIT编译器对锁的具体实现所做的一种优化,如果同步块所使用的锁对象通过逃逸分析出只有一个线程会访问,那么JIT编译器在编译这个同步块的时候会消除同步
  • 锁粗化
    • 如果在一段代码中对一个对象反复加锁解锁,那么会放宽锁的范围,减少性能消耗。

 如以下代码:

for(int i=0;i<100000;i++){  
    synchronized(this){  
        do();  
} 

粗化成:

synchronized(this){  
    for(int i=0;i<100000;i++){  
        do();  
} 

1.2.3 synchronized的死穴:锁是慢的

  虽然内置锁优化至今已经和显式锁相差无几,但是,它的死穴就是:锁是慢的。让我们来做一个实验,一个单线程对一个数字相加1kw次,加锁和不加锁的时间的对比。

/**
 * 对比有无锁的测试类。
 *
 * @author GrimMjx
 */
public class CompareLockTest {

    private int i = 0;

    private int y = 0;

    public void addWithNoLock() {
        i++;
    }

    public synchronized void addWithLock() {
        y++;
    }

    public static void main(String[] args) {
        // no lock
        CompareLockTest noLockTest = new CompareLockTest();
        StopWatch stopWatch = new StopWatch();

        stopWatch.start();
        for (int index = 0; index < 10000000; index++) {
            noLockTest.addWithNoLock();
        }
        stopWatch.stop();
        System.out.println("no lock: " + stopWatch.getTotalTimeMillis());


        // with lock
        stopWatch.start();
        for (int index = 0; index < 10000000; index++) {
            noLockTest.addWithLock();
        }
        stopWatch.stop();
        System.out.println("with lock: " + stopWatch.getTotalTimeMillis());
    }
}

  结果不加锁的大概是7毫秒,加锁大概是250毫秒。这还只是单线程,如果是多线程呢?并发很难而锁的性能糟糕。线程就像是两兄弟为一个玩具争吵,操作系统就像是父母来决定他们谁拿玩具。

1.2.4 如何加锁

  我们碰到最多的问题就是若没有则添加,我们来看一个例子,先写一个错误的加锁方式,后写一个正确的方式。

/**
 * list测试类。
 *
 * @author GrimMjx
 */
public class ListTest {

    public List<String> list = Collections.synchronizedList(new ArrayList<String>());

    /**
     * 非线程安全
     *
     * @param element
     * @return
     */
    public synchronized boolean unsafePutIfAbsent(String element) {
        boolean absent = !list.contains(element);
        if (absent) {
            list.add(element);
        }
        return absent;
    }

    /**
     * 线程安全
     *
     * @param element
     * @return
     */
    public boolean safePutIfAbsent(String element) {
        synchronized (list) {
            boolean absent = !list.contains(element);
            if (absent) {
                list.add(element);
            }
            return absent;
        }
    }
    
    // ...其他对list操作的方法
}

  第一个方法为何不是线程安全的?方法不是也已经用synchronized修饰了么?这个list也是线程安全的。对不对?问题在于在错误的锁上进行了同步,只是带来了同步的假象,这就意味着该方法相对于List的其他操作来说并不是原子的。因此无法确保当方法执行的时候,另外一个线程不会修改链表。

  第二个方法是正确的线程安全的,最重要的是因为list在外部加锁时要使用同一个锁。对于使用list的代码,使用list本身用于保护其状态的锁来保护这段代码。说白了就是你要知道你获取的什么锁,锁的是什么对象,这个是一定要搞清楚的。

 

1.3 死锁

1.3.1 死锁的介绍

  在多线程访问共享资源的情况下,如果对线程驾驭不当很容易引起死锁的情况发生。死锁又分:交叉锁、数据库锁等。比如说数据库锁,如果A线程执行了select xxx for update语句退出了事务,那么别的线程访问都将陷入死锁。简而言之,死锁说白了就是“我在等你,你也在等我”。还是写个例子吧。

/**
 * 死锁测试类。
 *
 * @author GrimMjx
 */
public class DeadLockTest {

    public static void main(String[] args) {
        Object a = new Object();
        Object b = new Object();

        new Thread(()->{
            synchronized (a) {
                System.out.println("已经锁住a了");
                synchronized (b){
                    System.out.println("同时锁住a和b了");
                }
            }
        }).start();

        new Thread(()->{
            synchronized (b) {
                System.out.println("已经锁住b了");
                synchronized (a){
                    System.out.println("同时锁住a和b了");
                }
            }
        }).start();
    }
}

  如果A线程已经获取a对象的锁,现在想要获取b对象的锁。此时B线程已经获取b对象的锁,想要获取a对象的锁。那么如果两个线程都不释放已经持有对象的锁,大家都无法拿到第二个对象的锁。如果程序出现死锁,可以利用jstack等工具进行分析。

  

posted @ 2018-12-01 22:46  GrimMjx  阅读(663)  评论(0编辑  收藏  举报