ThreadPoolExecutor线程池主要参数你都知道吗?

2022-09-20 18:37:09 浏览数 (1)

ThreadPoolExecutor线程池是并发编程中用的比较多的一个类,项目和面试的时候经常会用到,所以了解一下是很有必要的。

什么是线程池

线程池是池化技术的一种。它有以下优势:

  • 重复利用线程,降低线程创建和销毁带来的资源消耗
  • 统一管理线程,线程的创建和销毁都由线程池进行管理
  • 提高响应速度,线程创建已经完成,任务来到可直接处理,省去了创建时间

参数

ThreadPoolExecutor的最多参数的构造函数如下:

代码语言:javascript复制
public ThreadPoolExecutor(int corePoolSize,
                              int maximumPoolSize,
                              long keepAliveTime,
                              TimeUnit unit,
                              BlockingQueue<Runnable> workQueue,
                              ThreadFactory threadFactory,
                              RejectedExecutionHandler handler) 

ThreadPoolExecutor的创建主要参数有7个,接下来将进行一一介绍。

最大线程数(MaximumPoolSize)和核心线程数(CorePoolSize)

  • 最大线程数(MaximumPoolSize):线程池运行的最大线程数量,受属性CAPACITY的限制,最大为(2^29)-1(约5亿)
  • 核心线程数(CorePoolSize):线程池中保持最小活动数的线程数量,并且不允许超时,除非调用allowCoreThreadTimeOut方法,这个时候最小值是0。
  • 当线程池线程数量小于核心线程数时,一个新的任务请求被提交上来时,不管其他线程是否处于空闲状态,都会新建一个线程来处理这个请求。如果在运行的线程数数量超过核心线程数但是小于最大线程数,并且工作队列已满,将创建一个线程处理这个请求。

默认情况下,当一个任务请求时,核心线程数才会被创建和启动,但是也可以通过prestartCoreThread启动一个核心线程或者prestartAllCoreThread启动所有核心线程。

创建新的线程(ThreadFactory)

ThreadFactory用来创建线程。如果没有指定ThreadFactory的话,默认会使用Executors#defaultThreadFactory 来创建线程,并且这些线程都是在同一个ThreadGroup并且都是非守护线程状态(non-daemon status)并且拥有相同的优先级(NORM_PRIORITY)。如果指定了ThreadFactory 可以修改ThreadGroup和线程的名称、守护状态、优先级等。ThreadFactory如果调用newThread(Runnable r)方法返回null则创建线程失败,线程池会继续运行但可能不会执行任何任务。线程应该拥有"modifyThread"权限,如果工作线程或者其他线程没有拥有这个权限,服务可能会降级,配置更改可能不会及时生效,关闭线程池可能保持在可能终止但未完成的状态。

存活时间(Keep-alive times)

存活时间(Keep-alive times):空闲线程等待工作的超时时间(以纳秒为单位) 如果当前线程池中的线程数超过了核心线程数,超出的部分线程如果空闲的时长大于存活时长,那么他们将会被终止运行。当线程池不被频繁使用的时候,这提供了一种减少资源消耗的方法。存活时间可以通过setKeepAliveTime(long, TimeUnit)进行修改,使用 setKeepAliveTime(Long.MAX_VALUE, NANOSECONDS)有效地禁止空闲线程在关闭之前终止。默认情况下,存活策略只适用于当前线程数超过核心线程数的情况下。但是使用方法allowCoreThreadTimeOut(boolean)也可以将这个超时策略应用到核心线程,只要keepAliveTime值不为零。

时间单位(TimeUnit)

TimeUnit 是存活时间的单位。

阻塞队列(BlockingQueue)

任何实现了BlockingQueue接口的实现类都可以用来传输和保存提交的任务,阻塞队列的使用和线程池大小相关:

  1. 如果运行的线程少于核心线程数, Executor总是倾向于添加一个新线程而不是排队
  2. 如果核心线程数或更多线程正在运行(不超过最大线程数),Executor总是倾向于排队请求,而不是添加一个新线程
  3. 如果没有达到最大线程数并且队列未满,将创建新的线程执行任务,如果线程数大于最大线程数,任务将会被拒绝

三种排队策略

  1. 直接传递 工作队列的一个很好的默认选择是 SynchronousQueue,它将任务交给线程而不用其他方式持有它们。一个新的任务尝试排队时,如果没有可供使用的线程运行它时将会创建一个新的线程。该策略避免了锁定处理可能具有内部依赖关系的请求集,直接传递通常需要无界的最大线程池来避免新的任务提交。这反过来又承认了当命令的平均到达速度快于它们的处理速度时,线程无限增长的可能性。
  2. 无界队列 无界队列是一个没有预定义容量的队列,使用无界队列例如LinkedBlockingQueue将导致新任务一直在等待,当核心线程数的线程处于工作状态时。因此,不会有超过核心线程数的线程被创建,也就是说最大线程数是不起作用的。当任务之间互相独立,互不影响的时候这个选择可能是挺合适的。例如,在web服务器中,这种队列在消除短暂的高并发方面很有作用,它允许无界队列增长的平均速度比处理的平均速度快。
  3. 有界队列 无界队列例如ArrayBlockingQueue,它能在有限的最大线程数内防止资源耗尽,但是它也更难调整和控制。队列的大小和最大线程数可以互相替换:使用更大的队列数量和小的线程池数量能够最小化CPU的使用、系统资源和上下文切换的开销,但也人为的导致了低吞吐量。如果一个任务频繁的阻塞,例如频繁I/O,系统更多的时间是在频繁的调度而不是运行任务。使用小的队列通常需要大的线程池数量,这会让CPU更能充分利用,但是也会遇到不可接受的调度开销,也会降低吞吐量。

拒绝任务

在调用execute(Runnable)提交任务时,在Executor已经关闭或者有界队列的最大线程数和队列满的情况下任务会被拒绝。不论在什么情况下,execute方法调用RejectedExecutionHandler#rejectedExecution(Runnable, ThreadPoolExecutor)任务都会根据拒绝策略被拒绝。

四种拒绝策略

ThreadPoolExecutor预定义了四种拒绝策略:

  1. ThreadPoolExecutor.AbortPolicy,默认的拒绝策略,简单粗暴,拒绝的时候直接抛RejectedExecutionException异常
  2. ThreadPoolExecutor.CallerRunsPolicy,由调用者执行自身execute方法来运行提交进来的任务,从名字CallerRuns(调用者运行)中就可以看出。它会提供一个简单的反馈控制机制,这种策略将降低新任务被提交上来的速度。
  3. ThreadPoolExecutor.DiscardPolicy,也很简单粗暴,直接丢弃任务,不抛异常。
  4. ThreadPoolExecutor.DiscardOldestPolicy,DiscardOldest丢弃最早的任务,在队列头部也就是最新进入队列的任务会被丢弃,然后尝试提交新任务,如果提交失败会继续重复以上步骤。

也可以自己实现RejectedExecutionHandler接口,并重写rejectedExecution方法来自定义拒绝策略。

通俗解释

关于上面的参数我试着通俗的说一下,希望我说的能让你明白。

假如现在有一家外包公司(ThreadPoolExecutor),公司的核心开发(corePoolSize)有5个人,公司最多容纳(maximumPoolSize)10个开发,现在公司接了一个项目,核心开发还忙的过来,就将这个项目给其中一个核心开发做,慢慢的销售人员接的项目越来越多,5个核心开发都在做项目没时间再做新的项目,公司为了节省开支新来的项目只能先接过来暂时积压(BlockingQueue)起来,但是一直积压也不是个事情,客户也会一直催,公司顶住最多只能积压5个,积压到5个之后公司也还能容纳5个开发,不得不再招人处理新的项目。当公司发展的越来越好,接的项目也越来越多这10个开发也忙不过来了,有新的项目再进来就只能通过各种方式拒绝(RejectedExecutionHandler)了。再后来因为疫情原因,公司能接到的项目也越来越少了,开发人员很多(Thread)已经没事儿可做了,大概过了两周时间(keepAliveTime),公司又为了节省开支就把这些空闲下来的非核心开发给开了。当然,核心开发也不是说一定不能动也是可以开的(allowCoreThreadTimeOut(true)),只不过肯定是优先考虑非核心人员。有人说了,项目多的时候为啥不扩大公司规模呢?首先,公司老板最多也就有养这几个员工的的能力,养的多了老板也吃不消,多招一个人可能也不会使工作效率提高,反而可能拖累其他开发的进度,能养几个员工也是经过老板深思熟虑加以往的经验总结得出的结果。

线程池大致流程图

钩子方法(Hook methods)

ThreadPoolExecutor提供了protected权限的beforeExecute(Thread, Runnable)和afterExecute(Runnable, Throwable)方法供子类重写,这两个方法可以在任务执行的前后调用。这些可以用来操作执行环境,例如:重新初始化ThreadLocal、收集统计信息或者添加日志,类似静态代理。另外terminated方法也可以被重写用来处理特殊情况,当Executor完全被终止时。如果钩子方法或者回调方法抛异常,工作线程可能会执行失败或者突然终止。

队列维护

可以通过方法getQueue获取工作队列并进行监控和调试,如果是为了其他目的则强烈反对这么做。当大量的任务被取消时,方法remove(Runnable)和purge可用于储存回收。

线程池关闭

线程池如果在系统中没有再被引用并且没有线程在使用时将会被自动关闭,如果你想确保未被使用的线程池被回收即使用户忘记调用shutdown方法,你必须通过设置合适的存活时间、使用零核心线程的下限或者设置#allowCoreThreadTimeOut(boolean)来使未被使用的线程最终关闭。

能力一般,水平有限,如有错误,请多指出。

0 人点赞