阿里不允许使用 Executors 创建线程池!那怎么使用,怎么监控?
作者:小傅哥
沉淀、分享、成长,让自己和他人都能有所收获!😄
一、前言
五常大米好吃!
哈哈哈,是不你总买五常大米,其实五常和榆树是挨着的,榆树大米也好吃,榆树还是天下第一粮仓呢!但是五常出名,所以只认识五常。
为什么提这个呢,因为阿里不允许使用 Executors 创建线程池!其他很多大厂也不允许,这么创建的话,控制不好会出现OOM。
好,本篇就带你学习四种线程池的不同使用方式、业务场景应用以及如何监控线程。
二、面试题
谢飞机,小记!
,上次从面试官那逃跑后,恶补了多线程,自己好像也内卷了,所以出门逛逛!
面试官:嗨,飞机,飞机,这边!
谢飞机:嗯?!哎呀,面试官你咋来南海子公园了?
面试官:我家就附近,跑步来了。最近你咋样,上次问你的多线程学了吗?
谢飞机:哎,看了是看了,记不住鸭!
面试官:嗯,不常用确实记不住。不过你可以选择跳槽,来大厂,大厂的业务体量较大!
谢飞机:我就纠结呢,想回家考教师资格证了,我们村小学要教java了!
面试官:哈哈哈哈哈,一起!
三、四种线程池使用介绍
Executors
是创建线程池的工具类,比较典型常见的四种线程池包括:newFixedThreadPool
、newSingleThreadExecutor
、newCachedThreadPool
、newScheduledThreadPool
。每一种都有自己特定的典型例子,可以按照每种的特性用在不同的业务场景,也可以做为参照精细化创建线程池。
1. newFixedThreadPool
图解
代码:
new ThreadPoolExecutor(nThreads, nThreads, 0L, TimeUnit.MILLISECONDS, new LinkedBlockingQueue<Runnable>())
介绍:创建一个固定大小可重复使用的线程池,以
LinkedBlockingQueue
无界阻塞队列存放等待线程。风险:随着线程任务不能被执行的的无限堆积,可能会导致OOM。
2. newSingleThreadExecutor
图解
代码:
new ThreadPoolExecutor(1, 1, 0L, TimeUnit.MILLISECONDS, new LinkedBlockingQueue<Runnable>())
介绍:只创建一个执行线程任务的线程池,如果出现意外终止则再创建一个。
风险:同样这也是一个无界队列存放待执行线程,无限堆积下会出现OOM。
3. newCachedThreadPool
图解
代码:
new ThreadPoolExecutor(0, Integer.MAX_VALUE, 60L, TimeUnit.SECONDS, new SynchronousQueue<Runnable>())
介绍:首先
SynchronousQueue
是一个生产消费模式的阻塞任务队列,只要有任务就需要有线程执行,线程池中的线程可以重复使用。风险:如果线程任务比较耗时,又大量创建,会导致OOM
4. newScheduledThreadPool
图解
代码:
public ScheduledThreadPoolExecutor(int corePoolSize) { super(corePoolSize, Integer.MAX_VALUE, 0, NANOSECONDS, new ScheduledThreadPoolExecutor.DelayedWorkQueue()); }
介绍:这就是一个比较有意思的线程池了,它可以延迟定时执行,有点像我们的定时任务。同样它也是一个无限大小的线程池
Integer.MAX_VALUE
。它提供的调用方法比较多,包括:scheduleAtFixedRate
、scheduleWithFixedDelay
,可以按需选择延迟执行方式。风险:同样由于这是一组无限容量的线程池,所以依旧又OOM风险。
四、线程池使用场景说明
什么时候使用线程池?
说简单是当为了给老板省钱的时候,因为使用线程池可以降低服务器资源的投入,让每台机器尽可能更大限度的使用CPU。
😄那你这么说肯定没办法升职加薪了!
所以如果说的高大上一点,那么是在符合科特尔法则和阿姆达尔定律的情况下,引入线程池的使用最为合理。啥意思呢,还得简单说!
假如:我们有一套电商服务,用户浏览商品的并发访问速率是:1000客户/每分钟,平均每个客户在服务器上的耗时0.5分钟。根据利特尔法则,在任何时刻,服务端都承担着1000*0.5=500个客户的业务处理量。过段时间大促了,并发访问的用户扩了一倍2000客户了,那怎么保障服务性能呢?
提高服务器并发处理的业务量,即提高到2000×0.5=1000
减少服务器平均处理客户请求的时间,即减少到:2000×0.25=500
所以:在有些场景下会把串行的请求接口,压缩成并行执行,如图 22-5
但是,线程池的使用会随着业务场景变化而不同,如果你的业务需要大量的使用线程池,并非常依赖线程池,那么就不可能用 Executors
工具类中提供的方法。因为这些线程池的创建都不够精细化,也非常容易造成OOM风险,而且随着业务场景逻辑不同,会有IO密集型和CPU密集型。
最终,大家使用的线程池都是使用 new ThreadPoolExecutor()
创建的,当然也有基于Spring的线程池配置 org.springframework.scheduling.concurrent.ThreadPoolTaskExecutor
。
可你想过吗,同样一个接口在有活动时候怎么办、有大促时候怎么办,可能你当时设置的线程池是合理的,但是一到流量非常大的时候就很不适合了,所以如果能动态调整线程池就非常有必要了。而且使用 new ThreadPoolExecutor()
方式创建的线程池是可以通过提供的 set 方法进行动态调整的。有了这个动态调整的方法后,就可以把线程池包装起来,在配合动态调整的页面,动态更新线程池参数,就可以非常方便的调整线程池了。
五、获取线程池监控信息
你收过报警短信吗?
收过,半夜还有报警机器人打电话呢!崴,你的系统有个机器睡着了,快起来看看!!!
所以,如果你高频、高依赖线程池,那么有一个完整的监控系统,就非重要了。总不能线上挂了,你还不知道!
可监控内容
1. 重写线程池方式监控
如果我们想监控一个线程池的方法执行动作,最简单的方式就是继承这个类,重写方法,在方法中添加动作收集信息。
伪代码
2. 基于IVMTI方式监控
这块是监控的重点,因为我们不太可能让每一个需要监控的线程池都来重写的方式记录,这样的改造成本太高了。
那么除了这个笨方法外,可以选择使用基于JVMTI的方式,进行开发监控组件。
JVMTI:JVMTI(JVM Tool Interface)位于jpda最底层,是Java虚拟机所提供的native编程接口。JVMTI可以提供性能分析、debug、内存管理、线程分析等功能。
基于jvmti提供的接口服务,运用C++代码(win32-addlibrary)在AgentOnLoad里开发监控服务,并生成dll文件。开发完成后在java代码中加入agentpath,这样就可以监控到我们需要的信息内容。
环境准备:
Dev-C++
JetBrains CLion 2018.2.3
IntelliJ IDEA Community Edition 2018.3.1 x64
jdk1.8.0_45 64位
jvmti(在jdk安装目录下jdk1.8.0_45\include里,把include整个文件夹复制到和工程案例同层级目录下,便于 include 引用)
配置信息:(路径相关修改为自己的)
C++开发工具Clion配置
1.配置位置;Settings->Build,Execution,Deployment->Toolchains
2. MinGM配置:D:\Program Files (x86)\Dev-Cpp\MinGW64
java调试时配置
1. 配置位置:Run/Debug Configurations ->VM options
2. 配置内容:-agentpath:E:\itstack\git\github.com\itstack-jvmti\cmake-build-debug\libitstack_jvmti.dll
2.1 先做一个监控例子
Java工程
c++监控
测试结果
在 VM vptions 中配置:-agentpath:E:\itstack\git\github.com\itstack-jvmti\cmake-build-debug\libitstack_jvmti.dll
这就是基于JVMTI的方式进行监控,这样的方式可以做到非入侵代码。不需要硬编码,也就节省了人力,否则所有人都会进行开发监控内容,而这部分内容与业务逻辑并无关系。
2.2 扩展线程监控
其实方法差不多,都是基于C++开发DLL文件,引入使用。不过这部分代码会监控方法信息,并采集线程的执行内容。
从监控的代码可以看到,这里有线程的 start、stop、join、interrupt 等,并可以记录执行信息。
另外这里监控的方法执行回调,
SetEventCallbacks(&callbacks, sizeof(callbacks));
以及相应事件的添加。
六、总结
如果说你所经历的业务体量很小,那么几乎并不需要如此复杂的技术栈深度学习,甚至几乎不需要扩展各类功能,也不需要监控。但终究有一些需要造飞机的大厂,他们的业务体量庞大,并发数高,让原本可能就是一个简单的查询接口,也要做熔断、降级、限流、缓存、线程、异步、预热等等操作。
知其然才敢用,如果对一个技术点不是太熟悉,就不要胡乱使用,否则遇到的OOM并不是那么好复现,尤其是在并发场景下。当然如果你们技术体系中有各种服务,比如流量复现、链路追踪等等,那么还好。
又扯到了这,一个坚持学习、分享、沉淀的男人!好了,如果有错字、内容不准确,欢迎直接怼给我,我喜欢接受。但不要欺负我哦哈哈哈哈哈!
七、系列推荐
版权声明: 本文为 InfoQ 作者【小傅哥】的原创文章。
原文链接:【http://xie.infoq.cn/article/20d07d7bc75dd82f03b97a406】。文章转载请联系作者。
评论