ThreadLocal 使用与原理详解

 

ThreadLocal 使用与原理详解

 

 

1、简介

从字面意思上看,ThreadLocal可以解释成线程的局部变量,也就是说一个ThreadLocal的变量只有当前自身线程可以访问,别的线程都访问不了,那么自然就避免了线程竞争。ThreadLocal实例 通常来说都是private static类型的,用于关联线程和线程上下文。

特性:

  • 线程安全: 在多线程并发的场景下保证线程安全。
  • 传递数据: 我们可以通过ThreadLocal在同一线程,不同组件中传递公共变量。
  • 线程隔离: 每个线程的变量都是独立的,不会互相影响。

 

2、ThreadLocal的常用方法介绍

  • ThreadLocal(): 创建ThreadLocal对象
  • public void set( T value): 设置当前线程绑定的局部变量。
  • public T get(): 获取当前线程绑定的局部变量。
  • public void remove(): 移除当前线程绑定的局部变量。

3、ThreadLocal与synchronized的区别 

虽然ThreadLocal模式与synchronized关键字都用于处理多线程并发访问变量的问题, 不过两者处理问题的角度和思路不同。

  • ThreadLocal:采用'以空间换时间'的方式, 为每一个线程都提供了一份变量的副本,从而实现同时访问而相不干扰 。多线程中让每个线程之间的数据 相互隔离 。
  • synchronized:同步机制采用'以时间换空间'的 方式, 只提供了一份变量,让不同 的线程排队访问

 

4、ThreadLocal的实现原理

在JDK8中 ThreadLocal的设计是:每个Thread维护一个 ThreadLocalMap,这个Map的key是ThreadLocal实例本身,value才是真正要存储的值Object。 具体的过程是这样的:

  • 每个Thread线程内部都有一个Map (ThreadLocalMap) Map里面存储ThreadLocal对象(key)和线程的变量副本(value)。
  • Thread内部的Map是由ThreadLocal维护的,由ThreadLocal负责向map获取和设置线程的变量值。
  • 对于不同的线程,每次获取副本值时,别的线程并不能获取到当前线程的副本值,形成了副本的隔离,互不干 扰。 

这样设计好处:当Thread销毁之后,对应的ThreadLocalMap也会随之销毁,能减少内存的使用。

常用方法源码分析:

 /**
     * 设置当前线程对应的ThreadLocal的值
     * @param value
     */
    public void set(T value) {
        // 获取当前线程对象
        Thread t = Thread.currentThread();
        // 获取此线程对象中维护的ThreadLocalMap对象
        ThreadLocal.ThreadLocalMap map = getMap(t);
        if (map != null) {
            // 存在则调用map.set设置此实体entry
            map.set(this, value);
        } else {
            // 1、当前线程Thread 不存在ThreadLocalMap对象
            // 2、则调用createMap进行ThreadLocalMap对象的初始化
            // 3、并将 t(当前线程)和value(t对应的值)作为第一个entry存放至ThreadLocalMap中
            createMap(t, value);
        }
    }

    /**
     * 返回当前线程中保存ThreadLocal的值
     * @return
     */
    public T get() {
        // 获取当前线程对象
        Thread t = Thread.currentThread();
        // 获取此线程对象中维护的ThreadLocalMap对象
        ThreadLocal.ThreadLocalMap map = getMap(t);
        if (map != null) {
            // 以当前的ThreadLocal 为 key,调用getEntry获取对应的存储实体e
            ThreadLocal.ThreadLocalMap.Entry e = map.getEntry(this);
            if (e != null) {
                @SuppressWarnings("unchecked")
                T result = (T)e.value;
                return result;
            }
        }
        // 不存在则调用setInitialValue方法进行初始化
        return setInitialValue();
    }

ThreadLocalMap源码分析

 在分析ThreadLocal方法的时候,我们了解到ThreadLocal的操作实际上是围绕ThreadLocalMap展开的。ThreadLocalMap是ThreadLocal的内部类,没有实现Map接口,用独立的方式实现了Map的功能,其 内部的Entry也是独立实现。 

 

image

 成员变量:

        /**
         * 初始容量
         */
        private static final int INITIAL_CAPACITY = 16;

        /**
         * 存放数据的table,Entry类的定义在下面分析
         * 同样,数组长度必须是2的整次幂
         */
        private Entry[] table;

        /**
         * 当前容量
         */
        private int size = 0;

        /**
         * 扩容的阈值
         */
        private int threshold; // Default to 0

        /**
         * Set the resize threshold to maintain at worst a 2/3 load factor.
         */
        private void setThreshold(int len) {
            threshold = len * 2 / 3;
        }

存储结构Entry:

 /*
 * Entry继承WeakReference,并且用ThreadLocal作为key.
 * 如果key为null(entry.get() == null),意味着key不再被引用,
 * 因此这时候entry也可以从table中清除。
 */
 static class Entry extends WeakReference<ThreadLocal<?>> {
    /** The value associated with this ThreadLocal. */
    Object value;

    Entry(ThreadLocal<?> k, Object v) {
        super(k);
         value = v;
   }
 }

在ThreadLocalMap中,也是用Entry来保存K-V结构数据的。不过Entry中的key只能是ThreadLocal对 象,这点在构造方法中已经限定死了。 另外,Entry继承WeakReference,也就是key(ThreadLocal)是弱引用,其目的是将ThreadLocal对 象的生命周期和线程生命周期解绑。

 

5、理解ThreadLocal中的内存泄漏问题

内存泄漏相关概念 

  • Memory overflow: 内存溢出没有足够的内存提供申请者使用。
  • Memory leak:   内存泄漏是指程序中己动态分配的堆内存由于某种原因程序未释放或无法释放,造成系统内存的浪费,导致程序运行速度减慢甚至系统崩溃等严重后果。内存泄漏的堆积终将导致内存溢出。

弱引用(WeakReference):  垃圾回收器一旦发现了只具有弱引用的对象,不管当前内存空间足够与 否,都会回收它的内存。 

ThreadLocal内存泄漏的根源是:由于ThreadLocalMap的生命周期跟Thread一样长,如果没有 手动删除对应key就会导致内存泄漏。

为什么Key使用弱引用?

虽然ThreadLocalMap中的key是弱引用,当不存在外部强引用的时候,就会自动被回收,但是Entry中的value依然是强引用。这个value的引用链条如下:

可以看到,只有当Thread被回收时,这个value才有被回收的机会,否则,只要线程不退出,value总是会存在一个强引用。但是,要求每个Thread都会退出,是一个极其苛刻的要求,对于线程池来说,大部分线程会一直存在在系统的整个生命周期内,那样的话,就会造成value对象出现泄漏的可能。处理的方法是,在ThreadLocalMap进行set(),get(),remove()的时候,都会进行清理:
以getEntry()为例:
private Entry getEntry(ThreadLocal<?> key) {
    int i = key.threadLocalHashCode & (table.length - 1);
    Entry e = table[i];
    if (e != null && e.get() == key)
        //如果找到key,直接返回
        return e;
    else
        //如果找不到,就会尝试清理,如果你总是访问存在的key,那么这个清理永远不会进来
        return getEntryAfterMiss(key, i, e);
}

 

下面是getEntryAfterMiss()的实现:

private Entry getEntryAfterMiss(ThreadLocal<?> key, int i, Entry e) {
    Entry[] tab = table;
    int len = tab.length;

    while (e != null) {
        // 整个e是entry ,也就是一个弱引用
        ThreadLocal<?> k = e.get();
        //如果找到了,就返回
        if (k == key)
            return e;
        if (k == null)
            //如果key为null,说明弱引用已经被回收了
            //那么就要在这里回收里面的value了
            expungeStaleEntry(i);
        else
            //如果key不是要找的那个,那说明有hash冲突,这里是处理冲突,找下一个entry
            i = nextIndex(i, len);
        e = tab[i];
    }
    return null;
}

真正用来回收value的是 expungeStaleEntry() 方法,在get()、 remove() 和set()方法中,都会直接或者间接调用到这个方法进行value的清理:
从这里可以看到,ThreadLocal为了避免内存泄露,也算是花了一番大心思。不仅使用了弱引用维护key,还会在每个操作上检查key是否被回收,进而再回收value。
但是从中也可以看到,ThreadLocal并不能100%保证不发生内存泄漏。
比如,很不幸的,你的get()方法总是访问固定几个一直存在的ThreadLocal,那么清理动作就不会执行,如果你没有机会调用set()和remove(),那么这个内存泄漏依然会发生。
因此,一个良好的习惯依然是:当你不需要这个ThreadLocal变量时,主动调用remove(),这样对整个系统是有好处的。

 

5、ThreadLocalMap中的Hash冲突处理

ThreadLocalMap作为一个HashMap和java.util.HashMap的实现是不同的。对于java.util.HashMap使用的是链表法来处理冲突。但是,对于ThreadLocalMap,它使用的是简单的线性探测法,如果发生了元素冲突,该方法一次探测下一个地址,直到有空的地址后插入,若整个空间都找不到空余的地址,则产生溢 出。

 

6、可以被继承的ThreadLocal——InheritableThreadLocal

在实际开发过程中,我们可能会遇到这么一种场景。主线程开了一个子线程,但是我们希望在子线程中可以访问主线程中的ThreadLocal对象,也就是说有些数据需要进行父子线程间的传递。比如像这样:

public static void main(String[] args) {
    ThreadLocal threadLocal = new ThreadLocal();
    IntStream.range(0,10).forEach(i -> {
        //每个线程的序列号,希望在子线程中能够拿到
        threadLocal.set(i);
        //这里来了一个子线程,我们希望可以访问上面的threadLocal
        new Thread(() -> {
            System.out.println(Thread.currentThread().getName() + ":" + threadLocal.get());
        }).start();
        try {
            Thread.sleep(1000);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
    });
}

执行上述代码,你会看到:Thread-0:null Thread-1:null Thread-2:null Thread-3:null

因为在子线程中,是没有threadLocal的。如果我们希望子线可以看到父线程的ThreadLocal,那么就可以使用InheritableThreadLocal。顾名思义,这就是一个支持线程间父子继承的ThreadLocal,将上述代码中的threadLocal使用InheritableThreadLocal:
InheritableThreadLocal threadLocal = new InheritableThreadLocal();

再执行,就能看到:Thread-0:0 Thread-1:1 Thread-2:2 Thread-3:3 Thread-4:4

可以看到,每个线程都可以访问到从父进程传递过来的一个数据。虽然InheritableThreadLocal看起来挺方便的,但是依然要注意以下几点:

  1. 变量的传递是发生在线程创建的时候,如果不是新建线程,而是用了线程池里的线程,就不灵了
  2. 变量的赋值就是从主线程的map复制到子线程,它们的value是同一个对象,如果这个对象本身不是线程安全的,那么就会有线程安全问题


 

posted @ 2022-05-12 15:14  邓维-java  阅读(143)  评论(0)    收藏  举报