ThreadLocal--以副本的方式解决并发以及隔离问题

2022-05-13 08:42:32 浏览数 (1)

论是轻量级的Atomic、volatile,还是synchronized,其实都是采用同步的方式解决了线程安全问题。本节我们将介绍另外一种解决线程安全问题的思路,线程封闭。

如果你有一个全局共享的变量,那么多线程并发的时候,对这个共享变量的访问是不安全的。方法内的局部变量是线程安全的,由于每个线程都会有自己的副本。也就是说局部变量被封闭在线程内部,其它线程无法访问(引用型有所区别)。那么有没有作用域介于两者之间,既能保证线程安全,又不至于只局限于方法内部的方式呢?答案是肯定的,我们使用ThreadLocal就可以做到这一点。ThreadLocal变量的作用域是为线程,也就是说线程内跨方法共享。例如某个对象的方法A对threadLocal变量赋值,在同一个线程中的另外一个对象的方法B能够读取到该值。因为作用域为同一个线程,那么自然就是线程安全的。但是需要注意的是,如果threadLocal存储的是共享变量的引用,那么同样会有线程安全问题。

1、ThreadLocal 的使用场景

ThreadLocal的特性决定了它的使用场景。由于ThreadLocal中存储的变量是线程隔离的,所以一般在以下情况使用ThreadLocal:

1、存储需要在线程隔离的数据。比如线程执行的上下文信息,每个线程是不同的,但是对于同一个线程来说会共享同一份数据。Spring MVC的 RequestContextHolder 的实现就是使用了ThreadLocal;

2、跨层传递参数。层次划分在软件设计中十分常见。层次划分后,体现在代码层面就是每层负责不同职责,一个完整的业务操作,会由一系列不同层的类的方法调用串起来完成。有些时候第一层获得的一个变量值可能在第三层、甚至更深层的方法中才会被使用。如果我们不借助ThreadLocal,就只能一层层地通过方法参数进行传递。使用ThreadLocal后,在第一层把变量值保存到ThreadLocal中,在使用的层次方法中直接从ThreadLocal中取出,而不用作为参数在不同方法中传来传去。不过千万不要滥用ThreadLocal,它的本意并不是用来跨方法共享变量的。结合第一种情况,我们放入ThreadLocal跨层传递的变量一般也是具有上下文属性的。比如用户的信息等。这样我们在AOP处理异常或者其他操作时可以很方便地获取当前登录用户的信息。

2、如何使用 ThreadLocal

ThreadLocal使用起来非常简单,我们先看一个简单的例子。

可以看到每个线程为同一个ThreadLocal对象set不同的值,但各个线程打印出来的依旧是自己保存进去的值,并没有被其它线程所覆盖。

一般来说,在实践中,我们会把ThreadLocal对象声名为static final,作为私有变量封装到自定义的类中。另外提供static的set和get方法。如下面的代码:

代码语言:javascript复制
public final class OperationInfoRecorder {

    private static final ThreadLocal<OperationInfoDTO> THREAD_LOCAL = new ThreadLocal<>();

    private OperationInfoRecorder() {
    }

    public static OperationInfoDTO get() {
        return THREAD_LOCAL.get();
    }

    public static void set(OperationInfoDTO operationInfoDTO) {
        THREAD_LOCAL.set(operationInfoDTO);
    }

    public static void remove() {
        THREAD_LOCAL.remove();
    }
}

这样做的目的有二:

  • 1、static 确保全局只有一个保存OperationInfoDTO对象的ThreadLocal实例;
  • 2、final 确保ThreadLocal的实例不可更改。防止被意外改变,导致放入的值和取出来的不一致。另外还能防止ThreadLocal的内存泄漏,具体原因下文中会有讲解。

使用的时候可以在任何方法的任何位置调用OperationInfoRecorder的set或者get方法,保存和取出。如下面代码:

代码语言:javascript复制
OperationInfoRecorder.set(operationInfoDTO)
OperationInfoRecorder.get()

3、ThreadLocal源代码解析

学习到这里,你一定很好奇ThreadLocal是如何做到多个线程对同一个对象set操作,但只会get出自己set进去的值呢?这个现象有点违背我们的认知。接下来我们就从set方法入手,来看看ThreadLocal的源代码:

代码语言:javascript复制
   public void set(T value) {
        Thread t = Thread.currentThread();
        ThreadLocalMap map = getMap(t);
        if (map != null)
            map.set(this, value);
        else
            createMap(t, value);
    }

一眼看过去,一下就可以看到map。没错,如果ThreadLocal能够保存多个线程的变量值,那么它一定是借助容器来实现的。

这个map不是一般的map,可以看到它是通过当前线程对象获取到的ThreadLocalMap。看到这里应该看出些端倪,这个map其实是和Thread绑定的。接下来我们看getMap方法的代码:

代码语言:javascript复制
    ThreadLocalMap getMap(Thread t) {
        return t.threadLocals;
    }

原来这个ThreadLocal就存方法Thread对象上。下面我们看看Thread中的相关代码:

代码语言:javascript复制
    /* ThreadLocal values pertaining to this thread. This map is maintained
     * by the ThreadLocal class. */
    ThreadLocal.ThreadLocalMap threadLocals = null;

注释中写的很清楚,这个属性由ThreadLocal来维护。threadLocals的访问控制决定在包外是无法直接访问的。所以我们在使用的时候只能通过ThreadLocal对象来访问。

set时,会把当前threadLocal对象作为key,你想要保存的对象作为value,存入map。

看到这里,我们大至已经理清了ThreadLocal和Thread的关系,我们看下图:

我们接下来分析get方法,代码如下:

代码语言:javascript复制
public T get() {
  Thread t = Thread.currentThread();
  ThreadLocalMap map = getMap(t);
  if (map != null) {
    ThreadLocalMap.Entry e = map.getEntry(this);
    if (e != null) {
      @SuppressWarnings("unchecked")
      T result = (T)e.value;
      return result;
    }
  }
  return setInitialValue();
}

get方法也是先取得当前线程对象中保存的ThreadLocalMap对象,然后使用当前threadLocal对象从map中取得相应的value。

每个Thread的ThreadMap以threadLocal作为key,保存自己线程的value副本。我们可以这么来理解ThreadLocal,其实ThreadLocal对象是你要真正保存对象的身份代表。而这个身份在每个线程中对应的值,其实是保存在每个线程中,并没有保存在ThreadLocal对象中。

这里可以举个例子,学校里要每班评选一名学习标兵,一名道德标兵。班主任会进行评选然后记录下来。学生标兵及道德标兵的身份就是两个ThreadLocal对象,而每个班主任是一个线程,记录的评选结果的小本子就是ThreadLocalMap对象。每个班主任会在自己的小本子上记录下评选结果,比如说一班班主任记录:道德标兵:小明,学习标兵:小红。二班班主任记录:道德标兵:小赵,学习标兵:小岩。通过这个例子大家应该很清楚ThreadLocal的原理了。

ThreadLocal的设计真的非常巧妙,看似自己保存了每个线程的变量副本,其实每个线程的变量副本是保存在线程对象中,那么自然就线程隔离了。如此分析起来,是不是有一种ThreadLocal没做什么事情,却抢了头功的感觉?其实不然。Thread对象中用来保存变量副本的ThreadLocalMap的定义就在ThreadLocal中。我们接下来分析ThreadLocalMap的源代码。

4、ThreadLocalMap分析

ThreadLocalMap是ThreadLocal的静态内部类,我们单独一小节来讲解它。ThreadLocalMap的功能其实是和HashMap类似的,但是为什么不直接使用HashMap呢?在ThreadLocalMap中使用WeakReference包装后的ThreadLocal对象作为key,也就是说这里对ThreadLocal对象为弱引用。当ThreadLocal对象在ThreadLocalMap引用之外,再无其他引用的时候能够被垃圾回收。如下面代码所示:

代码语言:javascript复制
static class Entry extends WeakReference<ThreadLocal<?>> {
            /** The value associated with this ThreadLocal. */
            Object value;

            Entry(ThreadLocal<?> k, Object v) {
                super(k);
                value = v;
            }
        }

这样做会带来新的问题。如果ThreadLocal对象被回收,那么ThreadLocalMap中保存的key值就变成了null,而value会一直被Entry引用,而Entry又被threadLocalMap对象引用,threadLocalMap对象又被Thread对象所引用,那么当Thread一直不终结的话,value对象就会一直驻留在内存中,直至Thread被销毁后,才会被回收。这就是ThreadLocal引起内存泄漏问题。

而ThreadLocalMap在设计的时候也考虑到这一点,在get和set的时候,会把遇到的key为null的entry清理掉。不过这样做也不能100%保证能够清理干净。我们可以通过以下两种方式来避免这个问题:

  • 1、把ThreadLocal对象声明为static,这样ThreadLocal成为了类变量生命周期不是和对象绑定,而是和类绑定,延长了声明周期,避免了被回收;
  • 2、在使用完ThreadLocal变量后,手动remove掉,防止ThreadLocalMap中Entry一直保持对value的强引用。导致value不能被回收。

4、总结

通过本节学习,我们掌握了ThreadLocal 的原理和其使用场景。绝大多数情况下,ThreadLocal用于存储和线程相关的上下文信息,也就是线程共享的信息,便于同一线程的不同方法中取值,而不用作为方法参数层层传递。

0 人点赞