线程池（3）终止线程池原理

作者: 飞奔的口罩 | 来源:发表于2021-04-14 20:24 被阅读0次

线程池（3）终止线程池原理
面试题2019年7月
线程池
J.U.C之线程池06：源码解析-线程池的终止
大白话聊聊线程池的工作原理和核心参数
线程池
源码分析AsyncTask的工作原理
线程池
万字长文：带你透彻理解“线程池”
线程池ThreadPoolExecutor源码解析

终止线程池

一、终止线程池方法

1、 shutdown() 安全的终止线程池

- checkShutdownAccess()  核查当前线程是否有权限intercept()
- advanceRunState(SHUTDOWN) 设置CAS方式设置线程池shutdown状态
- interruptIdleWorkers()中断空闲线程
- onShutdown()钩子函数
- tryTerminate()尝试中断线程池

2、 shutdownNow() 强制终止线程池

- checkShutdownAccess()  核查当前线程是否有权限intercept()
- advanceRunState(STOP) 设置CAS方式设置线程池Stop状态
- interruptWorkers() 中断所有线程(不会尝试获取锁w.tryLock，直接intercept)
- tasks = drainQueue(); //将workQueue中的元素放入一个List并返回
- tryTerminate();尝试中断线程池

3、 awaitTermination(timeout) 等待线程池终止

- termination.awaitNanos(nanos);
private final Condition termination = mainLock.newCondition();
- 这个方法最长会等待timeout时间，返回线程池是否已经终止，如果超过timeout时间会返回false

shutdown()和shutdownNow()区别

和shutdownNow()区别：

1、interruptIdleWorker() 会通过w.tryLock()来判断worker是否空闲。

2、interruptWorkers() 只判断worker的state>0,即线程是start状态，就直接停止，不管是否有task正在运行。

3、tasks = drainQueue(); //将workQueue中的元素放入一个List并返回

源码解析

一、shutdown()

（1）shutdown()

/**
 * Initiates an orderly shutdown in which previously submitted
 * tasks are executed, but no new tasks will be accepted.
 * Invocation has no additional effect if already shut down.
 * 开始一个有序的关闭，在关闭中，之前提交的任务会被执行（包含正在执行的，在阻塞队列中的），但新任务会被拒绝
 * 如果线程池已经shutdown，调用此方法不会有附加效应
 *
 * <p>This method does not wait for previously submitted tasks to
 * complete execution.  Use {@link #awaitTermination awaitTermination}
 * to do that.
 * 当前方法不会等待之前提交的任务执行结束，可以使用awaitTermination()
 *
 * @throws SecurityException {@inheritDoc}
 */
public void shutdown() {
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock(); //上锁
     
    try {
        //判断调用者是否有权限shutdown线程池
        checkShutdownAccess();
         
        //CAS+循环设置线程池状态为shutdown
        advanceRunState(SHUTDOWN);
         
        //中断所有空闲线程
        interruptIdleWorkers();
         
        onShutdown(); // hook for ScheduledThreadPoolExecutor
    } 
    finally {
        mainLock.unlock(); //解锁
    }
     
    //尝试终止线程池
    tryTerminate();
}

shutdown()执行流程：

1、上锁，mainLock是线程池的主锁，是可重入锁，当要操作workers set这个保持线程的HashSet时，需要先获取mainLock，还有当要处理largestPoolSize、completedTaskCount这类统计数据时需要先获取mainLock

2、判断调用者是否有权限shutdown线程池

3、使用CAS操作将线程池状态设置为shutdown，shutdown之后将不再接收新任务

4、中断所有空闲线程 interruptIdleWorkers()

5、onShutdown()，ScheduledThreadPoolExecutor中实现了这个方法，可以在shutdown()时做一些处理

6、解锁

7、尝试终止线程池 tryTerminate()

（2）interruptIdleWorkers()

那么interruptIdleWorkers()是怎么中断线程的呢？

/**
 * Interrupts threads that might be waiting for tasks (as
 * indicated by not being locked) so they can check for
 * termination or configuration changes. Ignores
 * SecurityExceptions (in which case some threads may remain
 * uninterrupted).
 * 中断在等待任务的线程(没有上锁的)，中断唤醒后，可以判断线程池状态是否变化来决定是否继续
 *
 * @param onlyOne If true, interrupt at most one worker. This is
 * called only from tryTerminate when termination is otherwise
 * enabled but there are still other workers.  In this case, at
 * most one waiting worker is interrupted to propagate shutdown
 * signals in case(以免) all threads are currently waiting.
 * Interrupting any arbitrary thread ensures that newly arriving
 * workers since shutdown began will also eventually exit.
 * To guarantee eventual termination, it suffices to always
 * interrupt only one idle worker, but shutdown() interrupts all
 * idle workers so that redundant workers exit promptly, not
 * waiting for a straggler task to finish.
 * 
 * onlyOne如果为true，最多interrupt一个worker
 * 只有当终止流程已经开始，但线程池还有worker线程时,tryTerminate()方法会做调用onlyOne为true的调用
 * （终止流程已经开始指的是：shutdown状态 且 workQueue为空，或者 stop状态）
 * 在这种情况下，最多有一个worker被中断，为了传播shutdown信号，以免所有的线程都在等待
 * 为保证线程池最终能终止，这个操作总是中断一个空闲worker
 * 而shutdown()中断所有空闲worker，来保证空闲线程及时退出
 */
private void interruptIdleWorkers(boolean onlyOne) {
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock(); //上锁
    try {
        for (Worker w : workers) { 
            Thread t = w.thread;
             //w.tryLock非常关键，还记得execute()分析时，我们在runWorker时执行task.run()之前所做的吗，是的w.lock()，
             //每一个任务执行前都会先加上AQS不可重入锁。
             //所以在这如果tryLock()获取锁成功，那么意味着线程中并没有task正在执行。也就是空闲线程了。
            if (!t.isInterrupted() && w.tryLock()) {
                try {
                    t.interrupt();
                } catch (SecurityException ignore) {
                } finally {
                    w.unlock();
                }
            }
            if (onlyOne)
                break;
        }
    } finally {
        mainLock.unlock(); //解锁
    }
}

分析：

1、w.tryLock非常关键

runWorker()，在task执行前都会调用w.lock()先AQS不可重入锁锁住。
它的目的就是通过判断是否能获取锁，来确定线程中是否有task正在运行。如果没有task运行，那么tryLock()就能获取锁也就意味着线程处于空闲状态。这点是利用了不可重入锁AQS的特性。

2、Worker 是怎么实现AQS，不可重入的呢？

Worker本身继承了AQS(AbstractQueuedSynchronizer)
并实现了tryAcuire()方法，这个方法实际就是tryLock()的真实调用方法。也就是说tryLock()时会调用tryAcuire()方法。
tryAcuire()，利用CAS方式设置0->1 ，只有当前值为0时才能设置成功。正因为这个特性才做到的不可重入。

public boolean tryLock()  { return tryAcquire(1); }
protected boolean tryAcquire(int unused) {
    //CAS方式设置0->1 ，只有当前值为0时才能设置成功。正因为这个特性才做到的不可重入。
    if (compareAndSetState(0, 1)) {
        setExclusiveOwnerThread(Thread.currentThread());
        return true;
    }
    return false;
}

（3）tryTerminate()

/**
 * Transitions to TERMINATED state if either (SHUTDOWN and pool
 * and queue empty) or (STOP and pool empty).  If otherwise
 * eligible to terminate but workerCount is nonzero, interrupts an
 * idle worker to ensure that shutdown signals propagate. This
 * method must be called following any action that might make
 * termination possible -- reducing worker count or removing tasks
 * from the queue during shutdown. The method is non-private to
 * allow access from ScheduledThreadPoolExecutor.
 * 
 * 在以下情况将线程池变为TERMINATED终止状态
 * shutdown 且 正在运行的worker 和 workQueue队列 都empty
 * stop 且  没有正在运行的worker
 * 
 * 这个方法必须在任何可能导致线程池终止的情况下被调用，如：
 * 减少worker数量
 * shutdown时从queue中移除任务
 * 
 * 这个方法不是私有的，所以允许子类ScheduledThreadPoolExecutor调用
 */
final void tryTerminate() {
    //这个for循环主要是和进入关闭线程池操作的CAS判断结合使用的
    for (;;) {
        int c = ctl.get();
         
        /**
         * 线程池是否需要终止
         * 如果以下3中情况任一为true，return，不进行终止
         * 1、还在运行状态
         * 2、状态是TIDYING、或 TERMINATED，已经终止过了
         * 3、SHUTDOWN 且 workQueue不为空
         */
        if (isRunning(c) ||
            runStateAtLeast(c, TIDYING) ||
            (runStateOf(c) == SHUTDOWN && ! workQueue.isEmpty()))
            return;
         
        /**
         * 只有shutdown状态 且 workQueue为空，或者 stop状态能执行到这一步
         * 如果此时线程池还有线程（正在运行任务，正在等待任务）
         * 中断唤醒一个正在等任务的空闲worker
         * 唤醒后再次判断线程池状态，会return null，进入processWorkerExit()流程
         */
        if (workerCountOf(c) != 0) { // Eligible to terminate 资格终止
            interruptIdleWorkers(ONLY_ONE); //中断workers集合中的空闲任务，参数为true，只中断一个
            return;
        }
 
        /**
         * 如果状态是SHUTDOWN，workQueue也为空了，正在运行的worker也没有了，开始terminated
         */
        final ReentrantLock mainLock = this.mainLock;
        mainLock.lock();
        try {
            //CAS：将线程池的ctl变成TIDYING（所有的任务被终止，workCount为0，为此状态时将会调用terminated()方法），期间ctl有变化就会失败，会再次for循环
            if (ctl.compareAndSet(c, ctlOf(TIDYING, 0))) {
                try {
                    terminated(); //需子类实现
                } 
                finally {
                    ctl.set(ctlOf(TERMINATED, 0)); //将线程池的ctl变成TERMINATED
                    termination.signalAll(); //唤醒调用了 等待线程池终止的线程 awaitTermination() 
                }
                return;
            }
        }
        finally {
            mainLock.unlock();
        }
        // else retry on failed CAS
        // 如果上面的CAS判断false，再次循环
    }
}

tryTerminate() 执行流程：

1、判断线程池是否需要进入终止流程（只有当shutdown状态+workQueue.isEmpty 或 stop状态，才需要）

2、判断线程池中是否还有线程，有则 interruptIdleWorkers(ONLY_ONE) 尝试中断一个空闲线程（正是这个逻辑可以再次发出中断信号，中断阻塞在获取任务的线程）

3、如果状态是SHUTDOWN，workQueue也为空了，正在运行的worker也没有了，开始terminated

会先上锁，将线程池置为tidying状态，之后调用需子类实现的 terminated()，最后线程池置为terminated状态，并唤醒所有等待线程池终止这个Condition的线程

二、shutdownNow() -- 强制终止线程池

（1）shutdownNow()

/**
 * Attempts to stop all actively executing tasks, halts the
 * processing of waiting tasks, and returns a list of the tasks
 * that were awaiting execution. These tasks are drained (removed)
 * from the task queue upon return from this method.
 * 尝试停止所有活动的正在执行的任务，停止等待任务的处理，并返回正在等待被执行的任务列表
 * 这个任务列表是从任务队列中排出（删除）的
 *
 * <p>This method does not wait for actively executing tasks to
 * terminate.  Use {@link #awaitTermination awaitTermination} to
 * do that.
 * 这个方法不用等到正在执行的任务结束，要等待线程池终止可使用awaitTermination()
 *
 * <p>There are no guarantees beyond best-effort attempts to stop
 * processing actively executing tasks.  This implementation
 * cancels tasks via {@link Thread#interrupt}, so any task that
 * fails to respond to interrupts may never terminate.
 * 除了尽力尝试停止运行中的任务，没有任何保证
 * 取消任务是通过Thread.interrupt()实现的，所以任何响应中断失败的任务可能永远不会结束
 *
 * @throws SecurityException {@inheritDoc}
 */
public List<Runnable> shutdownNow() {
    List<Runnable> tasks;
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock(); //上锁
     
    try {
        //判断调用者是否有权限shutdown线程池
        checkShutdownAccess();
         
        //CAS+循环设置线程池状态为stop
        advanceRunState(STOP);
         
        //中断所有线程，包括正在运行任务的
        interruptWorkers();
         
        tasks = drainQueue(); //将workQueue中的元素放入一个List并返回
    } 
    finally {
        mainLock.unlock(); //解锁
    }
     
    //尝试终止线程池
    tryTerminate();
     
    return tasks; //返回workQueue中未执行的任务
}

shutdownNow() 和 shutdown()的大体流程相似，差别是：

1、将线程池更新为stop状态
2、调用 interruptWorkers() 中断所有线程，包括正在运行的线程
3、将workQueue中待处理的任务移到一个List中，并在方法最后返回，说明shutdownNow()后不会再处理workQueue中的任务

（2）interruptWorkers()

/**
 * Interrupts all threads, even if active. Ignores SecurityExceptions
 * (in which case some threads may remain uninterrupted).
 */
private void interruptWorkers() {
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();
    try {
        for (Worker w : workers)
            w.interruptIfStarted();
    } finally {
        mainLock.unlock();
    }
}

1、和interruptIdleWorkers()不同，这里并不会w.tryLock()尝试获取锁。所以它是忽略lock锁来直接操作的。
2、但是 interruptIfStarted()，其中会判断worker的AQS state是否大于0，即worker是否已经开始运作，再调用Thread.interrupt()。这里在worker分析时已经说过了。worker创建时state为-1，当在addWorker()中t.start()时，在run()方法中会重置state = 0。只有state >= 0的时候说明t.start()线程启动了。否则没必要去intercept()
3、需要注意的是，对于运行中的线程调用Thread.interrupt()并不能保证线程被终止，task.run()内部可能捕获了InterruptException，没有上抛，导致线程一直无法结束

（3） tasks = drainQueue();

todo

三、awaitTermination() -- 等待线程池终止

private final Condition termination = mainLock.newCondition();

public boolean awaitTermination(long timeout, TimeUnit unit)
    throws InterruptedException {
    long nanos = unit.toNanos(timeout);
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();
    try {
        //开启自旋
        for (;;) {
            //判断线程是否在termination状态之后，如果是则说明线程池已经结束了。
            if (runStateAtLeast(ctl.get(), TERMINATED))
                return true;
            //超过等待时间就返回false，告知线程池还没停止。
            if (nanos <= 0)
                return false;
            //通过condition.awaitNanos()方法，睡眠等待直到超过nanos时间，
            //仍没有结果则返回0。即下次循环直接return false了。
            nanos = termination.awaitNanos(nanos);
        }
    } finally {
        mainLock.unlock();
    }
}

参数：

timeout：超时时间
unit：     timeout超时时间的单位

true：线程池终止
false：超过timeout指定时间

在发出一个shutdown请求后，在以下3种情况发生之前，awaitTermination()都会被阻塞

1、所有任务完成执行

2、到达超时时间

3、当前线程被中断

awaitTermination() 循环的判断线程池是否terminated终止或是否已经超过超时时间，然后通过termination这个Condition阻塞等待一段时间

termination.awaitNanos() 是通过 LockSupport.parkNanos(this, nanosTimeout)实现的阻塞等待

阻塞等待过程中发生以下具体情况会解除阻塞（对上面3种情况的解释）：

1、如果发生了 termination.signalAll()（内部实现是 LockSupport.unpark()）会唤醒阻塞等待，且由于ThreadPoolExecutor只有在 tryTerminated()尝试终止线程池成功，
将线程池更新为terminated状态后才会signalAll()，故awaitTermination()再次判断状态会return true退出

2、如果达到了超时时间 termination.awaitNanos() 也会返回，此时nano==0，再次循环判断return false，等待线程池终止失败

3、如果当前线程被 Thread.interrupt()，termination.awaitNanos()会上抛InterruptException，awaitTermination()继续上抛给调用线程，会以异常的形式解除阻塞

故终止线程池并需要知道其是否终止可以用如下方式：

executorService.shutdown();
try{
    while(!executorService.awaitTermination(500, TimeUnit.MILLISECONDS)) {
        LOGGER.debug("Waiting for terminate");
    }
} 
catch (InterruptedException e) {
    //中断处理
}

线程池（3）终止线程池原理
终止线程池一、终止线程池方法 1、 shutdown() 安全的终止线程池 2、 shutdownNow() 强...
面试题2019年7月
线程池原理参考：Java 线程池原理分析线程池工作原理：1、线程数量小于 corePoolSize，直接创建新...
线程池
1、为什么要使用线程池2、线程池的工作原理3、线程池参数4、阻塞队列5、饱和策略6、向线程池提交任务7、线程池的状...
J.U.C之线程池06：源码解析-线程池的终止
线程池终止线程池ThreadPoolExecutor提供了shutdown()和shutDownNow()用于关...
大白话聊聊线程池的工作原理和核心参数
目录 1、为啥要使用线程池 2、线程池的工作原理 3、线程池都用哪些核心参数 4. 有界队列下的线程池的工作流程 ...
线程池
1.为什么要使用线程池？2.线程池的基本原理是什么？3.怎么学习线程池？线程池使用了池化技术。池化技术用于我们常见...
源码分析AsyncTask的工作原理
一、AsyncTask原理介绍 AsyncTask的实现原理 = 线程池+ Handler 其中：线程池用于线程调...
线程池
JDK线程池为什么要用线程池线程池为什么这么设计线程池原理核心线程是否能被回收如何回收空闲线程 Tomc...
万字长文：带你透彻理解“线程池”
目标【理解】线程池的基本概念【理解】线程池工作原理【掌握】自定义线程池【应用】java内置线程池【应用】...
线程池ThreadPoolExecutor源码解析
本文主要内容什么是线程池线程池的使用线程池的原理线程池中的位运算源码解析什么是线程池如果频繁创建线程...