美文网首页
线程池原理及调优

线程池原理及调优

作者: BugBean | 来源:发表于2019-08-15 16:53 被阅读0次

    为什么要用线程池

    在生产中,基本不会出现手动创建并启动线程的代码,因为这样做有几个弊端:

    • 频繁创建线程开销大
    • 线程的数量不可控
    • 线程数过多CPU来回切换开销大

    那么就需要一个对线程集中管理的工具,线程池应运而生,使用线程池有如下优势:

    • 减少创建新线程的时间
    • 重复利用线程池中的线程,不需要每次创建
    • 利用线程池可对线程进行统一的监控,分配,调优,控制最大并发数
    • 实现任务线程队列缓存策略和拒绝机制
    • 隔离线程环境

    JDK埋的坑

    JDK为了我们方便使用,提供了几种创建线程池的方法

    ExecutorService executorService = Executors.newCachedThreadPool();
    ExecutorService executorService = Executors.newSingleThreadExecutor();
    ExecutorService executorService = Executors.newFixedThreadPool(n);
    

    但是!这几种方法不能用!

    这不是我说的,阿里规范强制要求

    往下翻源码也可以看到

    public static ExecutorService newCachedThreadPool() {
        return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
                                      60L, TimeUnit.SECONDS,
                                      new SynchronousQueue<Runnable>());
    }
    
    public static ExecutorService newSingleThreadExecutor() {
        return new FinalizableDelegatedExecutorService
            (new ThreadPoolExecutor(1, 1,
                                    0L, TimeUnit.MILLISECONDS,
                                    new LinkedBlockingQueue<Runnable>()));
    }
    
    public static ExecutorService newFixedThreadPool(int nThreads) {
        return new ThreadPoolExecutor(nThreads, nThreads,
                                      0L, TimeUnit.MILLISECONDS,
                                      new LinkedBlockingQueue<Runnable>());
    }
    
    //这里队列的长度是Integer.MAX_VALUE,容易导致OOM
    public LinkedBlockingQueue() {
        this(Integer.MAX_VALUE);
    }
    

    核心类ThreadPoolExecutor

    通过上面的代码也能看到,Executors的几个创建线程池的方法,底层是调用了ThreadPoolExecutor

    为了避免踩坑,我们也得老老实实用ThreadPoolExecutor创建线程池

    七大参数和底层工作原理
    /**
    * ThreadPoolExecutor参数最全的构造方法
    */
    public ThreadPoolExecutor(int corePoolSize,
                              int maximumPoolSize,
                              long keepAliveTime,
                              TimeUnit unit,
                              BlockingQueue<Runnable> workQueue,
                              ThreadFactory threadFactory,
                              RejectedExecutionHandler handler) 
    

    数了一下,一共7个参数,那这7个参数分别代表什么?先看图

    1. 主线程执行execute或submit方法时,先判断核心池有没有满了,也就是判断正在执行的线程数若大于或等于corePoolSize,执行2
    2. 把任务放到阻塞队列中排队,若队列满了,执行3
    3. 临时创建新的线程,新线程的空闲时间如果超过keepAliveTime就会被销毁,而且新创建的线程数+核心池的线程数不能超过maximumPoolSize,若超过,执行4(关于这点我认为阿里的《码出高效》那本书说错了,大家可以自行查看源码)
    4. 执行相应的拒绝策略,拒绝执行

    由此可知,这7个参数分别代表:

    • int corePoolSize 核心池大小,阻塞队列未满时,最大同时执行线程数
    • int maximumPoolSize 最大池大小,最大a同时执行线程数
    • long keepAliveTime 最大池临时创建的新线程最大空闲时间,超过则被销毁
    • TimeUnit unit 最大空闲时间单位
    • BlockingQueue<Runnable> workQueue 阻塞队列,当核心池已满时,新提交的线程放进阻塞队列排队等候
    • ThreadFactory threadFactory 线程工厂,它用来生产一组相同任务的结程。线程池的命名是通过给这个 factory 增加组名前缀来实现的
    • RejectedExecutionHandler handler 拒绝策略,当阻塞队列和最大池都满了的时候,对新提交的线程执行拒绝策略,jdk自带四种拒绝策略
      1. DiscardPolicy:直接丢弃
      2. DiscardOldestPolicy:丢弃队列中排队时间最长的任务
      3. CallerRunsPolicy:将任务交给调用线程来执行
      4. AbortPolicy:抛异常

    调优

    这里说一下int maximumPoolSize参数的调优,因为maximumPoolSize是最后一道防线了,提交的线程数超过maximumPoolSize就执行拒绝策略了,所以maximumPoolSize的大小尤其重要。

    CPU密集型任务

    CPU密集型任务的特点是需要大量的运算,CPU全速运行,较少的IO而没有阻塞,所以对于CPU密集型任务,应该尽量减少线程切换带来的消耗,参考配置公式:
    maximumPoolSize=CPU核心数+1

    IO密集型任务

    IO密集型任务刚好相反,CPU占用较少,大量的阻塞,对于这种情况,应该尽量利用CPU的空闲时间,最大线程数应该配置比CPU核心数多,参考配置公式:
    maximumPoolSize=CPU核心数/(1-阻塞系数)
    0.8<阻塞系数<0.9

    相关文章

      网友评论

          本文标题:线程池原理及调优

          本文链接:https://www.haomeiwen.com/subject/ihzzjctx.html