Java并发专题（二）线程安全

前言

　　随着时代的发展，CPU核数的增加和计算速度的提升，串行化的任务执行显然是对资源的极大浪费，掌握多线程是每个程序员必须掌握的技巧。但是同时多线程也是一把双刃剑，带来了共享资源安全的隐患。在本节会介绍线程安全是什么、最基本的独占悲观式来保证线程安全的介绍。随着章节步步深入。

1.1 什么是线程安全？

1.1.1 初识线程安全的尴尬

　　本人是17年毕业的，刚进第一家公司的时候没有开发经验，对接第三方支付公司外部API压测的时候碰到一个问题：对方要求我5次/s，一共发300s的付款请求。其中一个请求的id，保证当日每一次唯一。我请求的id从1开始递增，但是总是也达不到300*5=1500。也闹出了很尴尬的笑话。这是我第一次接触多线程。为了简化问题，例子如下：2个线程对一个数字递增加2000次，看看是否最后是2000。

/**
 * 多线程递增某一个数字的测试类。
 *
 * @author GrimMjx
 */
public class UnsafeAdd {

    private int i;

    public int getNext() {
        return i++;
    }

    public static void main(String[] args) throws InterruptedException {
        UnsafeAdd multiAdd = new UnsafeAdd();

        Thread thread1 = new Thread(() -> {
            for (int i = 0; i < 1000; i++) {
                multiAdd.getNext();
            }
        });

        Thread thread2 = new Thread(() -> {
            for (int i = 0; i < 1000; i++) {
                multiAdd.getNext();
            }
        });

        thread1.start();
        thread2.start();

        //请结合上一章节体会为何写下面2行
        thread1.join();
        thread2.join();

        System.out.println(multiAdd.i);
    }
}

　　运行的结果99%都不是自己想要的结果，说明这边出现了线程安全的问题。除了这个例子相信很多同学都会听到类似这种话"HashMap不是线程安全的"、"不可变对象一定是线程安全的"等等。这些都是在说线程安全方面的话题，之后的源码分析专题会分析为什么HashMap不是线程安全的，取而代之的ConcurrentHashMap如何保证线程安全的？同时JDK6引入ConsurrentSkipListMap和ConcurrentSkipListSet分别作为同步的SortedMap和SortedSet的并发替代品，还有用synchronizedxxx()方法包装的Map。

1.1.2 线程安全的概念

　　对于线程安全的概念，参考《Java Concurrency in Practice》中的一句对线程安全的定义：当多个线程访问某个类时，这个类始终都能表现出正确的行为，那么这个类就是线程安全的。

1.1.3 Race condition（竞态条件）

　　现在我们来分析一下上面的数据不一致问题，这种情况成为竞态条件，为什么会出现这个问题？UnsafeAdd的问题在于，线程的执行是由CPU时间片轮询调度的，如果执行的时机不对，那么可能在调用getNext()方法的时候得到一样的值、或者某些值被忽略等。主要是i++;看起来是一个原子操作，但是它包含了3个独立的操作：读取i，将i+1，并将计算结果写入i。简单画一张图，如下：

　　线程A和线程B可能都读到i的变量为10，所以可能导致重复的情况，造成达不到2000的效果。

1.2 初识保证线程安全的基本方法

1.2.1 synchronized关键字

　　什么是synchronized？引入一段来自JDK官网对synchronized关键字比较权威的解释：Synchronized keyword enable a simple strategy for preventing thread interference and memory consistency errors: if an object is visible to more than one thread, all reads or writes to that object's variables are done through synchronized methods. 如果一个对象对多线程是可见的，那么对改对象的读写操作都将通过同步的方式进行。网上对他的讲解千千万，很多都是一样的。接下来讲一下我对他的具体表现：

synchronized关键字用到的是monitor enter和monitor exit两个JVM指令（请用javap命令自行研究），且遵循happens-before规则。能保证在monitor enter，获取到锁之前必须从主内存获取数据，而不是线程的本地内存。在monitor exit之后变量会刷新到主内存。（这里和上面的图都涉及到JMM模型，这是并发的基础，后面章节会详细介绍）
“synchronized是一把锁”，这种理解是不严谨的。准确的来说是某线程获取了对象的monitor锁，在没有释放该锁之前，其他线程在同一时刻无法获取该锁。
synchronized可以用于对代码块或者方法进行修饰，不能对变量进行修饰

　　如果要解决之前的问题，那么在getNext()方法上加上synchronized关键字就可以解决了问题。原因就是上面提到的，当某个线程获取了monitor锁，那么其他线程是无法获取锁的。也就是说其他线程都无法执行该方法，直到其他线程放弃该锁。每一个内置锁都有且只能有一个相关联的条件队列（这里的设计是否好呢？），当一个线程获取锁进行操作的时候，其他线程都在这个队列里等待该锁。那么解决掉问题也了解最基本的保证线程安全的方法之后，我们来看一下JDK对synchronized的优化以及synchronized的弊端。

1.2.2 synchronized的优化

自旋锁

自旋锁在JDK1.4引入，在JDK1.6默认开启。自旋锁到底是什么呢？之前我们说的互斥锁对性能的影响很大，Java线程是映射到操作系统的原生线程上的，如果要阻塞或者唤醒一个线程就需要操作系统的帮助，因此状态转换需要花费很多CPU时间。因为锁定的状态一般只会持续很短很短的时间，为了这段时间去挂起然后再唤醒是很不值得的。如果服务器有多个处理器，我们就可以让后面的线程稍微等等，但是并不放弃CPU执行时间，这个稍微等等的过程就是自旋。
自旋锁和阻塞锁很大的区别就是是否要放弃CPU执行时间

锁消除

锁消除是JIT编译器对锁的具体实现所做的一种优化，如果同步块所使用的锁对象通过逃逸分析出只有一个线程会访问，那么JIT编译器在编译这个同步块的时候会消除同步

锁粗化
- 如果在一段代码中对一个对象反复加锁解锁，那么会放宽锁的范围，减少性能消耗。

如以下代码：

for(int i=0;i<100000;i++){  
    synchronized(this){  
        do();  
}

粗化成：

synchronized(this){  
    for(int i=0;i<100000;i++){  
        do();  
}

1.2.3 synchronized的死穴：锁是慢的

　　虽然内置锁优化至今已经和显式锁相差无几，但是，它的死穴就是：锁是慢的。让我们来做一个实验，一个单线程对一个数字相加1kw次，加锁和不加锁的时间的对比。

/**
 * 对比有无锁的测试类。
 *
 * @author GrimMjx
 */
public class CompareLockTest {

    private int i = 0;

    private int y = 0;

    public void addWithNoLock() {
        i++;
    }

    public synchronized void addWithLock() {
        y++;
    }

    public static void main(String[] args) {
        // no lock
        CompareLockTest noLockTest = new CompareLockTest();
        StopWatch stopWatch = new StopWatch();

        stopWatch.start();
        for (int index = 0; index < 10000000; index++) {
            noLockTest.addWithNoLock();
        }
        stopWatch.stop();
        System.out.println("no lock: " + stopWatch.getTotalTimeMillis());


        // with lock
        stopWatch.start();
        for (int index = 0; index < 10000000; index++) {
            noLockTest.addWithLock();
        }
        stopWatch.stop();
        System.out.println("with lock: " + stopWatch.getTotalTimeMillis());
    }
}

　　结果不加锁的大概是7毫秒，加锁大概是250毫秒。这还只是单线程，如果是多线程呢？并发很难而锁的性能糟糕。线程就像是两兄弟为一个玩具争吵，操作系统就像是父母来决定他们谁拿玩具。

1.2.4 如何加锁

　　我们碰到最多的问题就是若没有则添加，我们来看一个例子，先写一个错误的加锁方式，后写一个正确的方式。

/**
 * list测试类。
 *
 * @author GrimMjx
 */
public class ListTest {

    public List<String> list = Collections.synchronizedList(new ArrayList<String>());

    /**
     * 非线程安全
     *
     * @param element
     * @return
     */
    public synchronized boolean unsafePutIfAbsent(String element) {
        boolean absent = !list.contains(element);
        if (absent) {
            list.add(element);
        }
        return absent;
    }

    /**
     * 线程安全
     *
     * @param element
     * @return
     */
    public boolean safePutIfAbsent(String element) {
        synchronized (list) {
            boolean absent = !list.contains(element);
            if (absent) {
                list.add(element);
            }
            return absent;
        }
    }
    
    // ...其他对list操作的方法
}

　　第一个方法为何不是线程安全的？方法不是也已经用synchronized修饰了么？这个list也是线程安全的。对不对？问题在于在错误的锁上进行了同步，只是带来了同步的假象，这就意味着该方法相对于List的其他操作来说并不是原子的。因此无法确保当方法执行的时候，另外一个线程不会修改链表。

　　第二个方法是正确的线程安全的，最重要的是因为list在外部加锁时要使用同一个锁。对于使用list的代码，使用list本身用于保护其状态的锁来保护这段代码。说白了就是你要知道你获取的什么锁，锁的是什么对象，这个是一定要搞清楚的。

1.3 死锁

1.3.1 死锁的介绍

　　在多线程访问共享资源的情况下，如果对线程驾驭不当很容易引起死锁的情况发生。死锁又分：交叉锁、数据库锁等。比如说数据库锁，如果A线程执行了select xxx for update语句退出了事务，那么别的线程访问都将陷入死锁。简而言之，死锁说白了就是“我在等你，你也在等我”。还是写个例子吧。

/**
 * 死锁测试类。
 *
 * @author GrimMjx
 */
public class DeadLockTest {

    public static void main(String[] args) {
        Object a = new Object();
        Object b = new Object();

        new Thread(()->{
            synchronized (a) {
                System.out.println("已经锁住a了");
                synchronized (b){
                    System.out.println("同时锁住a和b了");
                }
            }
        }).start();

        new Thread(()->{
            synchronized (b) {
                System.out.println("已经锁住b了");
                synchronized (a){
                    System.out.println("同时锁住a和b了");
                }
            }
        }).start();
    }
}

　　如果A线程已经获取a对象的锁，现在想要获取b对象的锁。此时B线程已经获取b对象的锁，想要获取a对象的锁。那么如果两个线程都不释放已经持有对象的锁，大家都无法拿到第二个对象的锁。如果程序出现死锁，可以利用jstack等工具进行分析。

posted @ 2018-12-01 22:46 GrimMjx 阅读(754) 评论(0) 收藏举报

刷新页面返回顶部

GrimMjx