美文网首页
ThreadLocal原理解析

ThreadLocal原理解析

作者: 梦想实现家_Z | 来源:发表于2021-06-12 16:57 被阅读0次
    • hash冲突问题

      首先看一下ThreadLocal的这一段源码:

      public class ThreadLocal<T> {
          // 创建ThreadLocal对象时立马初始化threadLocalHashCode
          private final int threadLocalHashCode = nextHashCode();
            // 所有ThreadLocal对象共享
          private static AtomicInteger nextHashCode =
              new AtomicInteger();
      
          // 魔数,自增步长
          private static final int HASH_INCREMENT = 0x61c88647;
            // 每次自增固定的值
          private static int nextHashCode() {
              return nextHashCode.getAndAdd(HASH_INCREMENT);
          }
      }
      

      根据上面代码的解析,可以看出,每次new一个ThreadLocal对象,threadLocalHashCode的值都会在上一个对象的threadLocalHashCode值基础上自增一个固定长度“0x61c88647”。

      public void set(T value) {
                    // 获取当前线程
              Thread t = Thread.currentThread();
                    // 获取线程中的ThreadLocalMap容器对象
              ThreadLocalMap map = getMap(t);
                    // 如果线程中已经有这个ThreadLocalMap容器对象了,那么直接把数据存进去
              if (map != null) {
                    // 注意,这里的this指的就是当前的ThreadLocal对象本身
                  map.set(this, value);
              } else {
                    // 如果当前线程中还没有这个ThreadLocalMap容器对象,那么就现在创建一个
                  createMap(t, value);
              }
          }
      
      // 说明ThreadLocalMap是线程中的一个对象
      ThreadLocalMap getMap(Thread t) {
              return t.threadLocals;
          }
      
      // 创建一个ThreadLocalMap容器对象,并且赋值给指定线程
      void createMap(Thread t, T firstValue) {
              t.threadLocals = new ThreadLocalMap(this, firstValue);
          }
      
      // 创建ThreadLocalMap容器对象
      ThreadLocalMap(ThreadLocal<?> firstKey, Object firstValue) {
                            // 初始化table数组
                  table = new Entry[INITIAL_CAPACITY];
                            // 通过threadLocalHashCode计算目标索引值
                  int i = firstKey.threadLocalHashCode & (INITIAL_CAPACITY - 1);
                            // 把ThreadLocal对象作为key,需要存储在线程中的数据作为value
                  table[i] = new Entry(firstKey, firstValue);
                  size = 1;
                  setThreshold(INITIAL_CAPACITY);
              }
      

      通过上述代码,可以看出:

      • 每一个线程中都会有一个ThreadLocalMap容器,这个容器就是一个【key:value】数组。

      • ThreadLocal是把自己本身作为key,存储对象作为value。

      • 每一个ThreadLocal对象都有不同的threadLocalHashCode,以便于它们更好地离散分布在ThreadLocalMap中。

      • 一个ThreadLocal对象在一个线程中,只能存储一个对象 image-20210612124541065.png

        如果ThreadLocal达到一定数量,通过threadLocalHashCode & (INITIAL_CAPACITY - 1)的算法计算目标索引值,必定会存在两个不同的ThreadLocal命中同一个索引值的情况。

      private void set(ThreadLocal<?> key, Object value) {
                  Entry[] tab = table;
                  int len = tab.length;
                            // 计算索引值
                  int i = key.threadLocalHashCode & (len-1);
                            // 在这个for循环中,只判断了
                            // 1.索引值下的key是否和当前ThreadLocal相等
                            // 2.索引值下的key是否为null
                            // 那么剩下的情况就是产生了hash冲突的情况
                  for (Entry e = tab[i];
                       e != null;
                       // 3.如果产生hash冲突了,那么需要计算下一个目标索引位置下的Entry
                       e = tab[i = nextIndex(i, len)]) {
                        // 获取目标索引值下的key
                      ThreadLocal<?> k = e.get();
                                    // 1.如果和当前的ThreadLocal是一个对象,那么直接取值
                      if (k == key) {
                          e.value = value;
                          return;
                      }
                        // 2.如果这个索引值下的key已经被回收掉了,那么肯定是直接覆盖掉这个位置
                      if (k == null) {
                            // replaceStaleEntry里面做了一些清理工作
                          replaceStaleEntry(key, value, i);
                          return;
                      }
                  }
      
                  tab[i] = new Entry(key, value);
                  int sz = ++size;
                  if (!cleanSomeSlots(i, sz) && sz >= threshold)
                      rehash();
              }
      // 写一个索引值就是一直向后自增,超过了整个容器大小,又回到索引0位置。
      // 注意:容器是有扩容策略的,如果ThreadLocal数量不是特别多的话,一般是不会到0索引位的。
       private static int nextIndex(int i, int len) {
                  return ((i + 1 < len) ? i + 1 : 0);
              }
      
      // 检查是否需扩容
      private void rehash() {
        expungeStaleEntries();
        // 检查是否大于等于四分之三
        if (size >= threshold - threshold / 4)
          // 扩容
          resize();
      }
      
      // 扩容就是创建一个原来长度两倍的数组
      private void resize() {
        Entry[] oldTab = table;
        int oldLen = oldTab.length;
        int newLen = oldLen * 2;
        Entry[] newTab = new Entry[newLen];
        int count = 0;
        for (Entry e : oldTab) {
          if (e != null) {
            ThreadLocal<?> k = e.get();
            if (k == null) {
              e.value = null; // Help the GC
            } else {
              int h = k.threadLocalHashCode & (newLen - 1);
              while (newTab[h] != null)
                h = nextIndex(h, newLen);
              newTab[h] = e;
              count++;
            }
          }
        }
        setThreshold(newLen);
        size = count;
        table = newTab;
      }
      

      所以在ThreadLocalMap中,一旦出现hash冲突的情况,就会通过线性探测的方式寻找下一个可以存放数据的位置。

      get()方法也是一样,如果发现目标位置的key与当前的ThreadLocal不是一个对象,那么也会通过线性探测的方式寻找目标位置,直至满足条件。

    • 内存泄漏问题

      首先,如果我们的线程不会循环使用的话,本身是不存在内存泄漏的问题的。因为线程属性threadLocals会随着线程的消亡被回收,也就不可能内存泄漏。

      因为线程资源宝贵,为了减少线程的创建,对线程做了循环利用。那么就会导致线程中的threadLocals在下一次使用前还有[key:value]键值对,并且因为一直有一个强引用指定value,那么gc并不会导致value的回收,在不断的循环利用过程中,必然会导致更多的value被创建而不被gc回收,最终导致内存泄漏。

      1.如果Entry中的key使用强引用的话,那么需要使用者手动将ThreadLocal置为null,否则ThreadLocal对象始终会有一个强引用被ThreadLocalMap持有,那么永远不会被回收,导致内存泄漏。

      2.如果Entry中的key使用弱引用的话,当ThreadLocal没有被任何对象任何强引用的时候,也就是该被回收的时候,那么就直接被回收了,不会因为ThreadLocalMap持有它的弱引用,导致它一直无法被回收而造成内存泄漏。

      其实从设计层面来说的话,也体现了ThreadLocal的封装性,既然不让开发者关心具体的key如何操作,那么自身内部就应该保证使用ThreadLocal的内存安全性,而不应该让使用者来处理和关心ThreadLocalMap对ThreadLocal的引用问题。

    为了证明一下只要ThreadLocal没有任何其他强引用,那么经过gc后就会立马被回收,我写了下面这段代码:

    public static void main(String[] args) throws InterruptedException {
            CountDownLatch countDownLatch = new CountDownLatch(1);
            new Thread(
                            () -> {
                                // 创建一个ThreadLocal对象
                                ThreadLocal<String> threadLocal = new ThreadLocal<>();
                                threadLocal.set("hello world");
                                // 让ThreadLocal对象没有任何强引用
                                threadLocal = null;
                                System.gc();
                                // 获取当前线程
                                Thread currentThread = Thread.currentThread();
                                // 可以在这一行打断点,查看currentThread里面的threadLocals对象
                                countDownLatch.countDown();
                            })
                    .start();
            countDownLatch.await();
        }
    
    image-20210612140215761.png

    如上图所示,gc后referent属性值为null,说明此时Entry中的key已经被回收了,但是value依然存在。

    如何处理value的强引用?

    可参照以下模版:

    ThreadLocal<String> threadLocal = new ThreadLocal<>();
    try{
      threadLocal.set("hello world");
        // todo
    }finally{
      threadLocal.remove();
    }
    

    无论key是强引用还是弱引用,threadLocal都必须要在代码逻辑执行完毕后调用remove()将value的强引用删掉,否则就会导致内存泄漏。
    也就是说,ThreadLocal不需要开发者关心key的回收问题,开发者只需要关心自己操作的value的回收问题即可。内部的归内部管理,外部的归外部管理,各司其职。

    相关文章

      网友评论

          本文标题:ThreadLocal原理解析

          本文链接:https://www.haomeiwen.com/subject/ysdieltx.html