ExecutorService介绍
ExecutorService提供了具体的设置线程池的方法以及一些其他方法用于设置线程池的属性,但是使用Executors工厂方法会更方便一些。
线程池主要解决两方面的问题:当执行大量异步任务时,使用线程池可以提高性能,主要是因为降低了每个任务的调用开销;而且它也提供了一种限制和管理资源的方式,包括在执行一组任务时使用的线程以及其他消耗的资源。ExecutorService也会执行一些基本的分析,例如执行完成的任务的数量。
当使用execute(Runnable)方法让线程池执行一个新任务时,
- 如果当前运行的线程数比核心线程数少(例如核心线程数是10,目前只有5个线程在运行),则创建一个新线程处理任务,即使其他工作线程处于空闲状态。
- 如果当前运行的线程数比核心线程数多,但是比maximumPoolSize少(例如核心线程数是10,最大线程数是100,当前有30个线程在运行),如果此时线程队列已满,则创建一个新的线程去执行任务,如果此时线程队列没有满的话,则把任务放到线程执行队列中等待执行(所以当线程队列满后,会创建新线程执行,此时加入的任务很可能会早于队列中的任务执行)
- 通过设置核心线程数和最大线程数为相同的值,则相当于创建了一个fixed-size类型的线程池;通过设置最大线程数为一个无限制的值,例如:Integer.MAX_VALUE,说明用户允许线程池可以容纳任意数量的并发任务。
- 常规时候,核心线程数和最大线程数应该只通过构造函数设置,没有必要在构造函数外进行设置,但是ExecutorService依然提供了set函数对这些参数进行动态设置,例如setCorePoolSize和setMaximumPoolSize。
默认状态下,核心线程只在新任务到达时才会被创建和启动,也即:在初始化线程池后,如果没有任务submit给线程池,则它的核心线程不会自动创建。但是也可以通过prestartCoreThread和prestartAllCoreThreads提前创建核心线程。如果使用一个非空队列创建一个线程池时,用户需要预先启动一些线程。
线程池中的线程使用ThreadFactory创建,ThreadFactory只是一个接口,里面只提供了一个newThread函数
public interface ThreadFactory {
Thread newThread(Runnable r);
}
如果没有特殊指定,ThreadFactory使用DefaultThreadFactory实现类来创建Thread,它创建的所有Thread都属于同一个ThreadGroup,具有相同的线程优先级(NORM_PRIORITY),并且都是非守护线程。通过使用不同的ThreadFactory,你可以修改线程的名字、线程的ThreadGroup、优先级、是否守护线程等属性。如果newThread(Runnable r)创建线程失败,例如newThread返回一个空对象,程序不会报错,executor会继续执行,但是并不能执行具体的任务了。
线程应该拥有运行时权限(RuntimePermission),如果线程池里面的工作线程或是其他线程没有此权限,服务可能会被降级,具体表现为:配置更改可能不会及时生效,shutdown一个线程池可能会处于一种termination的中间状态,并没有完全shutdown的状态(个人理解为:如果线程没有运行时权限,线程的状态可能不受控制或是执行结果不可靠)。
keep-alive介绍
如果当前线程池里面的线程数量超过了核心线程数,(例如核心线程数国10,线程池里面当前有30个线程),如果多出来的线程空闲时间超过了keep-alive设置的时间,则它们会被终止。终止超过一定时间不再使用的非核心线程也有利于节约系统资源。如果后续有更多的任务需要执行,则会创建新的线程来执行新任务,这个属性也可以通过setKeepAliveTime函数来动态修改。通过把这个属性设置为Long.MAX_VALUE可以不让系统终止空闲的非核心线程,因为它的超时时间设置为了MAX_VALUE,则永远不会超时。默认情况下,keep-alive只会应用在超过核心线程数的其他线程上,也就是说:它不影响核心线程的生存周期,如果核心线程一直空闲,系统也不会终止核心线程。但是使用allowCoreThreadTimeOut(boolean)可以用于设置核心线程是否也受keep-alive策略的控制。
Queuing介绍
- 如果线程池中运行的线程数小于核心线程数,当有新任务到来时会创建一个新线程去执行任务,而不是把任务放到队列中等待执行。
- 如果线程池中运行的线程数大于或等于核心线程数,当有新任务到来时会把任务放到队列中等待执行,而不是创建一个新线程去执行任务。
- 当新任务到来后不能放到入任务队列时(任务队列已满),会直接创建一个新线程执行任务,这有一个前提,也就是说线程池中的线程数要小于最大线程数。如果线程池中的线程数等于最大线程数了,再有新任务到来时,则直接拒绝接受此任务。
三种类型的Queuing
SynchronousQueue
这个工作队列是线程池默认使用的工作队列数据格式,这个队列会把任务交给线程处理,而不是占用它们。当有任务入队列时,如果没有立即可用的线程来执行这个任务,则入队列操作会失败,所以要求当有新任务到来时必须有新创建的线程来执行任务。
当处理一系列有内部依赖关系的请示时,这种策略能够避免死锁。
当使用这个队列数据结构时,需要设置maximumPoolSizes为Integer.MAX_VALUE,就是为了避免拒绝新提交的任务。
这个数据结构的使用也有一个弊端:由于设置了MAX_VALUE,它任务的执行速度比提交任务的速度慢,则会造成线程池中线程数量的无限增长,这必须是需要思考和解决的问题。
LinkedBlockingQueue
这个数据结构的存储容量理论上来说会有无限大,当然也会受内存容量的限制,因此当有新任务到来时,如果没有空闲的核心线程处理任务时,会把任务放入到队列中等待执行。(在使用这个数据结构存储任务时,maximumPoolSize的限制不起作用)当每个任务都互相独立,任务之间没有依赖时,使用这个数据结构是一个比较好的选择。
ArrayBlockingQueue
相对于LinkedBlockingQueue来说,ArrayBlockingQueue提供有限的任务存储容量,因此它不会出现资源枯竭的情况,且maximumPoolSize的限制会起作用。队列大小和maximumPoolSize的大小是相互影响的:使用大队列和小maximumPoolSize可以降低CPU的使用率,系统资源开销和上下文切换开销等,同时这也会带来系统吞吐量的降低。
使用小的队列容量一般需要搭配大的maximumPoolSize数值,这样可以保持CPU一直处于工作状态,但是也有可能会带来难以接受的调度开销,因为线程的状态会经常切换,这也会在一定程度上降低吞吐率。
每个队列数据结构都有适当的使用场景,核心线程数和maximumPoolSize也会影响执行效率,需要根据业务业务类型进行选择。
ThreadPoolExecutor类提供了两个空方法:beforeExecute(Thread, Runnable)和afterExecute(Runnable, Throwable),重写这两个方法可以在具体任务执行的前后做一些用户自定义的处理。例如做一些ThreadLocal方面的设置、收集分析、添加执行Log等处理。另外terminated()函数也可以被重写以便在线程池完全被terminate之前用来做一些特殊处理。线程池中的工作线程可能会失败、突然terminate、也有可能被替换。
当一个线程池中没有线程的时候或它不再被引用的时候,这个线程池会自动shutdown,当忘记对线程池执行shutdown而又希望在线程池不再使用后回收它的资源,可以通过设置keep-alive的次数,也可以通过设置核心线程数为0来实现(当核心线程为0时,则说明线程池中的线程都为非核心线程,它们都会有timeout时间,当空闲一定时间后会被terminate),或是设置allowCoreThreadTimeOut(true)来设置核心线程也有超时时间来实现这个功能。
beforeExecute()和afterExecute()
这两个空方法用于实现线程执行时的一些预处理和后处理工作,用户可以根据自己的业务实现具体的功能。
ThreadPoolExecutor内部封装了Worker类,Worker类又实现了Runnable接口,线程业务的执行其实就是执行了Runnable接口中的run()方法,run()方法中又调用runWorker(Runnable)方法,在runWorker中又调用了Runnable的run()方法,在run()方法的前、后会调用beforeExecute()和afterExecute()方法。
网友评论