ThreadLocal系列(一)-ThreadLocal的使用及原理解析

项目中我们如果想要某个对象在程序运行中的任意位置获取到,就需要借助ThreadLocal来实现,这个对象称作线程的本地变量,下面就介绍下ThreadLocal是如何做到线程内本地变量传递的,

下一篇:ThreadLocal系列(二)-InheritableThreadLocal的使用及原理解析

一、基本使用

先来看下基本用法:


    private static ThreadLocal tl = new ThreadLocal<>();

    public static void main(String[] args) throws Exception {
        tl.set(1);
        System.out.println(String.format("当前线程名称: %s, main方法内获取线程内数据为: %s",
                Thread.currentThread().getName(), tl.get()));
        fc();
        new Thread(ThreadLocalTest::fc).start();
    }

    private static void fc() {
        System.out.println(String.format("当前线程名称: %s, fc方法内获取线程内数据为: %s",
                Thread.currentThread().getName(), tl.get()));
    }

运行结果:


当前线程名称: main, main方法内获取线程内数据为: 1
当前线程名称: main, fc方法内获取线程内数据为: 1
当前线程名称: Thread-0, fc方法内获取线程内数据为: null

可以看到,main线程内任意地方都可以通过ThreadLocal获取到当前线程内被设置进去的值,而被异步出去的fc调用,却由于替换了执行线程,而拿不到任何数据值,那么我们现在再来改造下上述代码,在异步发生之前,给Thread-0线程也设置一个上下文数据:


private static ThreadLocal tl = new ThreadLocal<>();

    public static void main(String[] args) throws Exception {
        tl.set(1);
        System.out.println(String.format("当前线程名称: %s, main方法内获取线程内数据为: %s",
                Thread.currentThread().getName(), tl.get()));
        fc();
        new Thread(()->{
            tl.set(2); //在子线程里设置上下文内容为2
            fc();
        }).start();
        Thread.sleep(1000L); //保证下面fc执行一定在上面异步代码之后执行
        fc(); //继续在主线程内执行,验证上面那一步是否对主线程上下文内容造成影响
    }

    private static void fc() {
        System.out.println(String.format("当前线程名称: %s, fc方法内获取线程内数据为: %s",
                Thread.currentThread().getName(), tl.get()));
    }

运行结果为:


当前线程名称: main, main方法内获取线程内数据为: 1
当前线程名称: main, fc方法内获取线程内数据为: 1
当前线程名称: Thread-0, fc方法内获取线程内数据为: 2
当前线程名称: main, fc方法内获取线程内数据为: 1

可以看到,主线程和子线程都可以获取到自己的那份上下文里的内容,而且互不影响。

二、原理分析

ok,上面通过一个简单的例子,我们可以了解到ThreadLocal(以下简称TL)具体的用法,这里先不讨论它实质上能给我们带来什么好处,先看看其实现原理,等这些差不多了解完了,我再通过我曾经做过的一个项目,去说明TL的作用以及在企业级项目里的用处。

我以前在不了解TL的时候,想着如果让自己实现一个这种功能的轮子,自己会怎么做,那时候的想法很单纯,觉得通过一个Map就可以解决,Map的key设置为Thread.currentThread(),value设置为当前线程的本地变量即可,但后来想想就觉得不太现实了,实际项目中可能存在大量的异步线程,对于内存的开销是不可估量的,而且还有个严重的问题,线程是运行结束后就销毁的,如果按照上述的实现方案,map内是一直持有这个线程的引用的,导致明明执行结束的线程对象不能被jvm回收,造成内存泄漏,时间久了,会直接OOM。

所以,java里的实现肯定不是这么简单的,下面,就来看看java里的具体实现吧。

先来了解下,TL的基本实现,为了避免上述中出现的问题,TL实际上是把我们设置进去的值以k-v的方式放到了每个Thread对象内(TL对象做k,设置的值做v),也就是说,TL对象仅仅起到一个标记、对Thread对象维护的map赋值的作用。

先从set方法看起:


public void set(T value) {
        Thread t = Thread.currentThread(); //获取当前线程
        ThreadLocal.ThreadLocalMap map = getMap(t); //获取到当前线程持有的ThreadLocalMap对象
        if (map != null)
            map.set(this, value); //直接set值,具体方法在下面
        else
            createMap(t, value); // 为空就给当前线程创建一个ThreadLocalMap对象,赋值给Thread对象,具体方法在下面
    }

    ThreadLocal.ThreadLocalMap getMap(Thread t) {
        return t.threadLocals; //每个线程都有一个ThreadLocalMap,key为TL对象(其实是根据对象hash计算出来的值),value为该线程在此TL对象下存储的内容值
    }

    private void set(ThreadLocal<?> key, Object value) {

        ThreadLocal.ThreadLocalMap.Entry[] tab = table; //获取存储k-v对象的数组(散列表)
        int len = tab.length;
        int i = key.threadLocalHashCode & (len-1); //根据TL对象的hashCode(也是特殊计算出来的,保证每个TL对象的hashCode不同)计算出下标

        for (ThreadLocal.ThreadLocalMap.Entry e = tab[i];
             e != null;
             e = tab[i = nextIndex(i, len)]) { //线性探查法解决哈希冲突问题,发现下标i已经有Entry了,则就查看i+1位置处是否有值,以此类推
            ThreadLocal<?> k = e.get(); //获取k

            if (k == key) { //若k就是当前TL对象,则直接为其value赋值
                e.value = value;
                return;
            }

            if (k == null) { //若k为空,则认为是可回收的Entry,则利用当前k和value组成新的Entry替换掉该可回收Entry
                replaceStaleEntry(key, value, i);
                return;
            }
        }

        //for循环执行完没有终止程序,说明遇到了空槽,这个时候直接new对象赋值即可
        tab[i] = new ThreadLocal.ThreadLocalMap.Entry(key, value);
        int sz = ++size;
        if (!cleanSomeSlots(i, sz) && sz >= threshold) //这里用来清理掉k为null的废弃Entry
            rehash(); //如果没有发生清除Entry并且size超过阈值(阈值 = 最大长度 * 2/3),则进行扩容
    }


    //直接为当前Thread初始化它的ThreadLocalMap对象
    void createMap(Thread t, T firstValue) {
        t.threadLocals = new ThreadLocal.ThreadLocalMap(this, firstValue);
    }

    ThreadLocalMap(ThreadLocal<?> firstKey, Object firstValue) {
        table = new ThreadLocal.ThreadLocalMap.Entry[INITIAL_CAPACITY]; //初始化数组
        int i = firstKey.threadLocalHashCode & (INITIAL_CAPACITY - 1); //计算初始位置
        table[i] = new ThreadLocal.ThreadLocalMap.Entry(firstKey, firstValue); //因为初始化不存在hash冲突,直接new
        size = 1;
        setThreshold(INITIAL_CAPACITY); //给阈值赋值,上面已经提及,阈值 = 最大长度 * 2/3
    }

通过上述代码,我们大致了解了TL在set值的时候发生的一些操作,结合之前说的,我们可以确定的是,TL其实对于线程来说,只是一个标识,而真正线程的本地变量被保存在每个线程对象的ThreadLocalMap里,这个map里维护着一个Entry[]的数组(散列表),Entry是个k-v结构的对象(如图1-1),k为TL对象,v为对应TL保存在该线程内的本地变量值,值得注意的是,这里的k针对TL对象的引用是个弱引用,来看下源码:


static class Entry extends WeakReference<ThreadLocal<?>> {
            /** The value associated with this ThreadLocal. */
            Object value;

            Entry(ThreadLocal<?> k, Object v) {
                super(k);
                value = v;
            }
        }

为什么这里需要弱引用呢?我们先来看一张图,结合上面的介绍和这张图,来了解TL和Thread间的关系:

图1-1

图中虚线表示弱引用,那么为什么要这么做呢?

简单来说,一个TL对象被创建出来,并且被一个线程放到自己的ThreadLocalMap里,假如TL对象失去原有的强引用,但是该线程还没有死亡,如果k不是弱引用,那么就意味着TL并不能被回收,现在k为弱引用,那么在TL失去强引用的时候,gc可以直接回收掉它,弱引用失效,这就是上面代码里会进行检查,k=null的清除释放内存的原因(这个可以参考下面expungeStaleEntry方法,而且set、get、remove都会调用该方法,这也是TL防止内存泄漏所做的处理)。

 

综上,简单来说这个弱引用就是用来解决由于使用TL不当导致的内存泄漏问题的,假如没有弱引用,那么你又用到了线程池(池化后线程不会被销毁),然后TL对象又是局部的,那么就会导致线程池内线程里的ThreadLocalMap存在大量的无意义的TL对象引用,造成过多无意义的Entry对象,因为即便调用了set、get等方法检查k=null,也没有作用,这就导致了内存泄漏,长时间这样最终可能导致OOM,所以TL的开发者为了解决这种问题,就将ThreadLocalMap里对TL对象的引用改为弱引用,一旦TL对象失去强引用,TL对象就会被回收,那么这里的弱引用指向的值就为null,结合上面说的,调用操作方法时会检查k=null的Entry进行回收,从而避免了内存泄漏的可能性。

 

因为TL解决了内存泄漏的问题,因此即便是局部变量的TL对象且启用线程池技术,也比较难造成内存泄漏的问题,而且我们经常使用的场景就像一开始的示例代码一样,会初始化一个全局的static的TL对象,这就意味着该对象在程序运行期间都不会存在强引用消失的情况,我们可以利用不同的TL对象给不同的Thread里的ThreadLocalMap赋值,通常会set值(覆盖原有值),因此在使用线程池的时候也不会造成问题,异步开始之前set值,用完以后remove,TL对象可以多次得到使用,启用线程池的情况下如果不这样做,很可能业务逻辑也会出问题(一个线程存在之前执行程序时遗留下来的本地变量,一旦这个线程被再次利用,get时就会拿到之前的脏值);

 

说完了set,我们再来看下get:


public T get() {
        Thread t = Thread.currentThread();
        ThreadLocal.ThreadLocalMap map = getMap(t); //获取线程内的ThreadLocalMap对象
        if (map != null) {
            ThreadLocal.ThreadLocalMap.Entry e = map.getEntry(this); //根据当前TL对象(key)获取对应的Entry
            if (e != null) {
                @SuppressWarnings("unchecked")
                T result = (T)e.value;
                return result; //直接返回value即可
            }
        }
        return setInitialValue(); //如果发现当前线程还没有ThreadLocalMap对象,则进行初始化
    }

    private ThreadLocal.ThreadLocalMap.Entry getEntry(ThreadLocal<?> key) {
        int i = key.threadLocalHashCode & (table.length - 1); //计算下标
        ThreadLocal.ThreadLocalMap.Entry e = table[i];
        if (e != null && e.get() == key) //根据下标获取的Entry对象如果key也等于当前TL对象,则直接返回结果即可
            return e;
        else
            return getEntryAfterMiss(key, i, e); //上面说过,有些情况下存在下标冲突的问题,TL是通过线性探查法来解决的,所以这里也一样,如果上面没找到,则继续通过下标累加的方式继续寻找
    }

    private ThreadLocal.ThreadLocalMap.Entry getEntryAfterMiss(ThreadLocal<?> key, int i, ThreadLocal.ThreadLocalMap.Entry e) {
        ThreadLocal.ThreadLocalMap.Entry[] tab = table;
        int len = tab.length;

        while (e != null) {
            ThreadLocal<?> k = e.get(); //继续累加下标的方式一点点的往下找
            if (k == key) //找到了就返回出去结果
                return e;
            if (k == null) //这里也会检查k==null的Entry,满足就执行删除操作
                expungeStaleEntry(i);
            else //否则继续累加下标查找
                i = nextIndex(i, len);
            e = tab[i];
        }
        return null; //找不到返回null
    }


    //这里也放一下nextIndex方法
    private static int nextIndex(int i, int len) {
        return ((i + 1 < len) ? i + 1 : 0);
    }

最后再来看看remove方法:


public void remove() {
        ThreadLocal.ThreadLocalMap m = getMap(Thread.currentThread());
        if (m != null)
            m.remove(this); //清除掉当前线程ThreadLocalMap里以当前TL对象为key的Entry
    }

    private void remove(ThreadLocal<?> key) {
        ThreadLocal.ThreadLocalMap.Entry[] tab = table;
        int len = tab.length;
        int i = key.threadLocalHashCode & (len-1); //计算下标
        for (ThreadLocal.ThreadLocalMap.Entry e = tab[i];
             e != null;
             e = tab[i = nextIndex(i, len)]) {
            if (e.get() == key) { //找到目标Entry
                e.clear(); //清除弱引用
                expungeStaleEntry(i); //通过该方法将自己清除
                return;
            }
        }
    }

    private int expungeStaleEntry(int staleSlot) { //参数为目标下标
        ThreadLocal.ThreadLocalMap.Entry[] tab = table;
        int len = tab.length;

        tab[staleSlot].value = null; //首先将目标value清除
        tab[staleSlot] = null;
        size--;

        // Rehash until we encounter null
        ThreadLocal.ThreadLocalMap.Entry e;
        int i;
        // 由目标下标开始往后逐个检查,k==null的清除掉,不等于null的要进行rehash
        for (i = nextIndex(staleSlot, len);
             (e = tab[i]) != null;
             i = nextIndex(i, len)) {
            ThreadLocal<?> k = e.get();
            if (k == null) { 
                e.value = null;
                tab[i] = null;
                size--;
            } else {
                int h = k.threadLocalHashCode & (len - 1);
                if (h != i) {
                    tab[i] = null;

                    // Unlike Knuth 6.4 Algorithm R, we must scan until
                    // null because multiple entries could have been stale.
                    while (tab[h] != null)
                        h = nextIndex(h, len);
                    tab[h] = e;
                }
            }
        }
        return i;
    }

目前主要方法set、get、remove已经介绍完了,包含其内部存在的弱引用的作用,以及实际项目中建议的用法,以及为什么要这样用,也进行了简要的说明,下面一篇会进行介绍InheritableThreadLocal的用法以及其原理性分析。

posted @ 2019-02-15 11:12  是胖虎捏  阅读(6033)  评论(0编辑  收藏  举报