美文网首页
不怕难之线程池原理

不怕难之线程池原理

作者: 天外流星for | 来源:发表于2018-07-20 14:20 被阅读0次

    一、线程池状态

    ThreadPoolExecutor 是 JDK 中的线程池实现,这个类实现了一个线程池需要的各个方法,它实现了任务提交、线程管理、监控等等方法。

    原理图:

    private final AtomicIntegerctl =new AtomicInteger(ctlOf(RUNNING, 0));

        // 这里 COUNT_BITS 设置为 29(32-3),意味着前三位用于存放线程状态,后29位用于存放线程数

    // 很多初学者很喜欢在自己的代码中写很多 29 这种数字,或者某个特殊的字符串,然后分布在各个地方,这是非常糟糕的

        private static final int COUNT_BITS = Integer.SIZE -3;

        // 000 11111111111111111111111111111

    // 这里得到的是 29 个 1,也就是说线程池的最大线程数是 2^29-1=536870911

    // 以我们现在计算机的实际情况,这个数量还是够用的

        private static final int CAPACITY  = (1 <

        // 我们说了,线程池的状态存放在高 3 位中

    // 运算结果为 111跟29个0:111 00000000000000000000000000000

        private static final int RUNNING    = -1 <

        // 000 00000000000000000000000000000

        private static final int SHUTDOWN  =0 <

        // 001 00000000000000000000000000000

        private static final int STOP      =1 <

        // 010 00000000000000000000000000000

        private static final int TIDYING    =2 <

        // 011 00000000000000000000000000000

        private static final int TERMINATED =3 <

        // 将整数 c 的低 29 位修改为 0,就得到了线程池的状态

        private static int runStateOf(int c)    {return c & ~CAPACITY; }

    // 将整数 c 的高 3 为修改为 0,就得到了线程池中的线程数

        private static int workerCountOf(int c)  {return c &CAPACITY; }

    private static int ctlOf(int rs, int wc) {return rs | wc; }

    /*

    * Bit field accessors that don't require unpacking ctl.

    * These depend on the bit layout and on workerCount being never negative.

    */

        private static boolean runStateLessThan(int c, int s) {

    return c < s;

        }

    private static boolean runStateAtLeast(int c, int s) {

    return c >= s;

        }

    private static boolean isRunning(int c) {

    return c

        }

    RUNNING:这个没什么好说的,这是最正常的状态:接受新的任务,处理等待队列中的任务

    SHUTDOWN:不接受新的任务提交,但是会继续处理等待队列中的任务

    STOP:不接受新的任务提交,不再处理等待队列中的任务,中断正在执行任务的线程

    TIDYING:所有的任务都销毁了,workCount 为 0。线程池的状态在转换为 TIDYING 状态时,会执行钩子方法 terminated()

    TERMINATED:terminated() 方法结束后,线程池的状态就会变成这个

    二、Worker对象设计

    private final class Worker

    extends AbstractQueuedSynchronizer

    implements Runnable

    {

    private static final long serialVersionUID =6138294804551838833L;

        // 这个是真正的线程,任务靠你啦

        final Threadthread;

        // 前面说了,这里的 Runnable 是任务。为什么叫 firstTask?因为在创建线程的时候,如果同时指定了

    // 这个线程起来以后需要执行的第一个任务,那么第一个任务就是存放在这里的(线程可不止执行这一个任务)

    // 当然了,也可以为 null,这样线程起来了,自己到任务队列(BlockingQueue)中取任务(getTask 方法)就行了

        RunnablefirstTask;

        // 用于存放此线程完全的任务数,注意了,这里用了 volatile,保证可见性

        volatile long completedTasks;

        // Worker 只有这一个构造方法,传入 firstTask,也可以传 null

        Worker(Runnable firstTask) {

    setState(-1); // inhibit interrupts until runWorker

            this.firstTask = firstTask;

            // 调用 ThreadFactory 来创建一个新的线程

            this.thread = getThreadFactory().newThread(this);

        }

    // 这里调用了外部类的 runWorker 方法

        public void run() {

    runWorker(this);

        }

    ...// 其他几个方法没什么好看的,就是用 AQS 操作,来获取这个线程的执行权,用了独占锁

    }

    三、execute

    public void execute(Runnable command) {

    if (command ==null)

    throw new NullPointerException();

        // 前面说的那个表示 “线程池状态” 和 “线程数” 的整数

        int c = ctl.get();

        // 如果当前线程数少于核心线程数,那么直接添加一个 worker 来执行任务,

    // 创建一个新的线程,并把当前任务 command 作为这个线程的第一个任务(firstTask)

        if (workerCountOf(c) < corePoolSize) {

    // 添加任务成功,那么就结束了。提交任务嘛,线程池已经接受了这个任务,这个方法也就可以返回了

    // 至于执行的结果,到时候会包装到 FutureTask 中。

    // 返回 false 代表线程池不允许提交任务

            if (addWorker(command, true))

    return;

            c = ctl.get();

        }

    // 到这里说明,要么当前线程数大于等于核心线程数,要么刚刚 addWorker 失败了

    // 如果线程池处于 RUNNING 状态,把这个任务添加到任务队列 workQueue 中

        if (isRunning(c) && workQueue.offer(command)) {

    /* 这里面说的是,如果任务进入了 workQueue,我们是否需要开启新的线程

    * 因为线程数在 [0, corePoolSize) 是无条件开启新的线程

    * 如果线程数已经大于等于 corePoolSize,那么将任务添加到队列中,然后进到这里

    */

            int recheck = ctl.get();

            // 如果线程池已不处于 RUNNING 状态,那么移除已经入队的这个任务,并且执行拒绝策略

            if (! isRunning(recheck) && remove(command))

    reject(command);

                // 如果线程池还是 RUNNING 的,并且线程数为 0,那么开启新的线程

    // 到这里,我们知道了,这块代码的真正意图是:担心任务提交到队列中了,但是线程都关闭了

            else if (workerCountOf(recheck) ==0)

    addWorker(null, false);

        }

    // 如果 workQueue 队列满了,那么进入到这个分支

    // 以 maximumPoolSize 为界创建新的 worker,

    // 如果失败,说明当前线程数已经达到 maximumPoolSize,执行拒绝策略

        else if (!addWorker(command, false))

    reject(command);

    }

    四、添加任务

    // 第一个参数是准备提交给这个线程执行的任务,之前说了,可以为 null

    // 第二个参数为 true 代表使用核心线程数 corePoolSize 作为创建线程的界线,也就说创建这个线程的时候,

    //        如果线程池中的线程总数已经达到 corePoolSize,那么不能响应这次创建线程的请求

    //        如果是 false,代表使用最大线程数 maximumPoolSize 作为界线

    private boolean addWorker(Runnable firstTask, boolean core) {

    retry:

    for (;;) {

    int c = ctl.get();

            int rs = runStateOf(c);

            // 这个非常不好理解

    // 如果线程池已关闭,并满足以下条件之一,那么不创建新的 worker:

    // 1. 线程池状态大于 SHUTDOWN,其实也就是 STOP, TIDYING, 或 TERMINATED

    // 2. firstTask != null

    // 3. workQueue.isEmpty()

    // 简单分析下:

    // 还是状态控制的问题,当线程池处于 SHUTDOWN 的时候,不允许提交任务,但是已有的任务继续执行

    // 当状态大于 SHUTDOWN 时,不允许提交任务,且中断正在执行的任务

    // 多说一句:如果线程池处于 SHUTDOWN,但是 firstTask 为 null,且 workQueue 非空,那么是允许创建 worker 的

            if (rs >= SHUTDOWN &&

    ! (rs == SHUTDOWN &&

    firstTask ==null &&

    ! workQueue.isEmpty()))

    return false;

            for (;;) {

    int wc = workerCountOf(c);

                if (wc >= CAPACITY ||

    wc >= (core ? corePoolSize : maximumPoolSize))

    return false;

                // 如果成功,那么就是所有创建线程前的条件校验都满足了,准备创建线程执行任务了

    // 这里失败的话,说明有其他线程也在尝试往线程池中创建线程

                if (compareAndIncrementWorkerCount(c))

    break retry;

                // 由于有并发,重新再读取一下 ctl

                c = ctl.get();

                // 正常如果是 CAS 失败的话,进到下一个里层的for循环就可以了

    // 可是如果是因为其他线程的操作,导致线程池的状态发生了变更,如有其他线程关闭了这个线程池

    // 那么需要回到外层的for循环

                if (runStateOf(c) != rs)

    continue retry;

                // else CAS failed due to workerCount change; retry inner loop

            }

    }

    /*

    * 到这里,我们认为在当前这个时刻,可以开始创建线程来执行任务了,

    * 因为该校验的都校验了,至于以后会发生什么,那是以后的事,至少当前是满足条件的

    */

    // worker 是否已经启动

        boolean workerStarted =false;

        // 是否已将这个 worker 添加到 workers 这个 HashSet 中

        boolean workerAdded =false;

        Worker w =null;

        try {

    final ReentrantLock mainLock =this.mainLock;

            // 把 firstTask 传给 worker 的构造方法

            w =new Worker(firstTask);

            // 取 worker 中的线程对象,之前说了,Worker的构造方法会调用 ThreadFactory 来创建一个新的线程

            final Thread t = w.thread;

            if (t !=null) {

    // 这个是整个类的全局锁,持有这个锁才能让下面的操作“顺理成章”,

    // 因为关闭一个线程池需要这个锁,至少我持有锁的期间,线程池不会被关闭

                mainLock.lock();

                try {

    int c = ctl.get();

                    int rs = runStateOf(c);

                    // 小于 SHUTTDOWN 那就是 RUNNING,这个自不必说,是最正常的情况

    // 如果等于 SHUTDOWN,前面说了,不接受新的任务,但是会继续执行等待队列中的任务

                    if (rs < SHUTDOWN ||

    (rs == SHUTDOWN && firstTask ==null)) {

    // worker 里面的 thread 可不能是已经启动的

                        if (t.isAlive())

    throw new IllegalThreadStateException();

                        // 加到 workers 这个 HashSet 中

                        workers.add(w);

                        int s = workers.size();

                        // largestPoolSize 用于记录 workers 中的个数的最大值

    // 因为 workers 是不断增加减少的,通过这个值可以知道线程池的大小曾经达到的最大值

                        if (s > largestPoolSize)

    largestPoolSize = s;

                        workerAdded =true;

                    }

    }finally {

    mainLock.unlock();

                }

    // 添加成功的话,启动这个线程

                if (workerAdded) {

    // 启动线程

                    t.start();

                    workerStarted =true;

                }

    }

    }finally {

    // 如果线程没有启动,需要做一些清理工作,如前面 workCount 加了 1,将其减掉

            if (! workerStarted)

    addWorkerFailed(w);

        }

    // 返回线程是否启动成功

        return workerStarted;

    }

    五、执行任务

    // 此方法由 worker 线程启动后调用,这里用一个 while 循环来不断地从等待队列中获取任务并执行

    // 前面说了,worker 在初始化的时候,可以指定 firstTask,那么第一个任务也就可以不需要从队列中获取

    final void runWorker(Worker w) {

    //

        Thread wt = Thread.currentThread();

        // 该线程的第一个任务(如果有的话)

        Runnable task = w.firstTask;

        w.firstTask =null;

        w.unlock(); // allow interrupts

        boolean completedAbruptly =true;

        try {

    // 循环调用 getTask 获取任务

            while (task !=null || (task = getTask()) !=null) {

    w.lock();

                // 如果线程池状态大于等于 STOP,那么意味着该线程也要中断

                if ((runStateAtLeast(ctl.get(), STOP) ||

    (Thread.interrupted() &&

    runStateAtLeast(ctl.get(), STOP))) &&

    !wt.isInterrupted())

    wt.interrupt();

                try {

    // 这是一个钩子方法,留给需要的子类实现

                    beforeExecute(wt, task);

                    Throwable thrown =null;

                    try {

    // 到这里终于可以执行任务了

                        task.run();

                    }catch (RuntimeException x) {

    thrown = x; throw x;

                    }catch (Error x) {

    thrown = x; throw x;

                    }catch (Throwable x) {

    // 这里不允许抛出 Throwable,所以转换为 Error

                        thrown = x; throw new Error(x);

                    }finally {

    // 也是一个钩子方法,将 task 和异常作为参数,留给需要的子类实现

                        afterExecute(task, thrown);

                    }

    }finally {

    // 置空 task,准备 getTask 获取下一个任务

                    task =null;

                    // 累加完成的任务数

                    w.completedTasks++;

                    // 释放掉 worker 的独占锁

                    w.unlock();

                }

    }

    completedAbruptly =false;

        }finally {

    // 如果到这里,需要执行线程关闭:

    // 1. 说明 getTask 返回 null,也就是说,这个 worker 的使命结束了,执行关闭

    // 2. 任务执行过程中发生了异常

    // 第一种情况,已经在代码处理了将 workCount 减 1,这个在 getTask 方法分析中会说

    // 第二种情况,workCount 没有进行处理,所以需要在 processWorkerExit 中处理

    // 限于篇幅,我不准备分析这个方法了,感兴趣的读者请自行分析源码

            processWorkerExit(w, completedAbruptly);

        }

    }

    六、获取任务

    // 此方法有三种可能:

    // 1. 阻塞直到获取到任务返回。我们知道,默认 corePoolSize 之内的线程是不会被回收的,

    //      它们会一直等待任务

    // 2. 超时退出。keepAliveTime 起作用的时候,也就是如果这么多时间内都没有任务,那么应该执行关闭

    // 3. 如果发生了以下条件,此方法必须返回 null:

    //    - 池中有大于 maximumPoolSize 个 workers 存在(通过调用 setMaximumPoolSize 进行设置)

    //    - 线程池处于 SHUTDOWN,而且 workQueue 是空的,前面说了,这种不再接受新的任务

    //    - 线程池处于 STOP,不仅不接受新的线程,连 workQueue 中的线程也不再执行

    private RunnablegetTask() {

    boolean timedOut =false; // Did the last poll() time out?

        retry:

    for (;;) {

    int c = ctl.get();

            int rs = runStateOf(c);

            // 两种可能

    // 1. rs == SHUTDOWN && workQueue.isEmpty()

    // 2. rs >= STOP

            if (rs >= SHUTDOWN && (rs >= STOP || workQueue.isEmpty())) {

    // CAS 操作,减少工作线程数

                decrementWorkerCount();

    return null;

            }

    boolean timed;      // Are workers subject to culling?

            for (;;) {

    int wc = workerCountOf(c);

                // 允许核心线程数内的线程回收,或当前线程数超过了核心线程数,那么有可能发生超时关闭

                timed = allowCoreThreadTimeOut || wc > corePoolSize;

                // 这里 break,是为了不往下执行后一个 if (compareAndDecrementWorkerCount(c))

    // 两个 if 一起看:如果当前线程数 wc > maximumPoolSize,或者超时,都返回 null

    // 那这里的问题来了,wc > maximumPoolSize 的情况,为什么要返回 null?

    //    换句话说,返回 null 意味着关闭线程。

    // 那是因为有可能开发者调用了 setMaximumPoolSize 将线程池的 maximumPoolSize 调小了

                if (wc <= maximumPoolSize && ! (timedOut && timed))

    break;

                if (compareAndDecrementWorkerCount(c))

    return null;

                c = ctl.get();  // Re-read ctl

    // compareAndDecrementWorkerCount(c) 失败,线程池中的线程数发生了改变

                if (runStateOf(c) != rs)

    continue retry;

                // else CAS failed due to workerCount change; retry inner loop

            }

    // wc <= maximumPoolSize 同时没有超时

            try {

    // 到 workQueue 中获取任务

                Runnable r = timed ?

    workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :

    workQueue.take();

                if (r !=null)

    return r;

                timedOut =true;

            }catch (InterruptedException retry) {

    // 如果此 worker 发生了中断,采取的方案是重试

    // 解释下为什么会发生中断,这个读者要去看 setMaximumPoolSize 方法,

    // 如果开发者将 maximumPoolSize 调小了,导致其小于当前的 workers 数量,

    // 那么意味着超出的部分线程要被关闭。重新进入 for 循环,自然会有部分线程会返回 null

                timedOut =false;

            }

    }

    }

    七、案例分析

    ThreadPoolExecutor pool =new ThreadPoolExecutor(1,2,60, TimeUnit.SECONDS,new ArrayBlockingQueue<>(3));

    MyTask task1 =new MyTask(1,"任务1");

    MyTask task2 =new MyTask(2,"任务2");

    MyTask task3 =new MyTask(3,"任务3");

    MyTask task4 =new MyTask(4,"任务4");

    MyTask task5 =new MyTask(5,"任务5");

    pool.execute(task1);

    pool.execute(task2);

    pool.execute(task3);

    pool.execute(task4);

    pool.execute(task5);

    八、总结

    1. 线程池中的线程创建时机

    如果当前线程数少于 corePoolSize,那么提交任务的时候创建一个新的线程,并由这个线程执行这个任务;

    如果当前线程数已经达到 corePoolSize,那么将提交的任务添加到队列中,等待线程池中的线程去队列中取任务;

    如果队列已满,那么创建新的线程来执行任务,需要保证池中的线程数不会超过 maximumPoolSize,如果此时线程数超过了 maximumPoolSize,那么执行拒绝策略。

    2. 关键属性

    corePoolSize 到 maximumPoolSize 之间的线程会被回收,当然 corePoolSize 的线程也可以通过设置而得到回收(allowCoreThreadTimeOut(true))。

    workQueue 用于存放任务,添加任务的时候,如果当前线程数超过了 corePoolSize,那么往该队列中插入任务,线程池中的线程会负责到队列中拉取任务。

    keepAliveTime 用于设置空闲时间,如果线程数超出了 corePoolSize,并且有些线程的空闲时间超过了这个值,会执行关闭这些线程的操作

    rejectedExecutionHandler 用于处理当线程池不能执行此任务时的情况,默认有抛出 RejectedExecutionException 异常忽略任务使用提交任务的线程来执行此任务将队列中等待最久的任务删除,然后提交此任务这四种策略,默认为抛出异常。

    相关文章

      网友评论

          本文标题:不怕难之线程池原理

          本文链接:https://www.haomeiwen.com/subject/tuafmftx.html