最新分享:如何避免线程安全的坑?看这一篇就够了
我们知道多线程能并发的处理多个任务,有效地提高复杂应用程序的性能,在实际开发中扮演着十分重要的角色
但是使用多线程也带来了很多风险,并且由线程引起的问题往往在测试中难以发现,到了线上就会造成重大的故障和损失
下面我会结合几个实际案例,帮助大家在工作做规避这些问题
多线程问题
首先介绍下使用的多线程会有哪些问题
使用多线程的问题很大程度上源于多个线程对同一变量的操作权,以及不同线程之间执行顺序的不确定性
《Java 并发编程实战》这本书中提到了三种多线程的问题:安全性问题、活跃性问题和性能问题
安全性问题
例如有一段很简单的扣库存功能操作,如下:
在单线程环境下,这个方法能正确工作,但在多线程环境下,就会导致错误的结果
--count 看上去是一个操作,但实际上它包含三步(读取-修改-写入):
读取 count 的值
将值减一
最后把计算结果赋值给 count
如下图展示了一种错误的执行过程,当有两个线程 1、2 同时执行该方法时,它们读取到 count 的值都是 10,最后返回结果都是 9;意味着可能有两个人购买了商品,但库存却只减了 1,这对于真实的生产环境是不可接受的
像上面例子这样由于不恰当的执行时序导致不正确结果的情况,是一种很常见的并发安全问题,被称为竞态条件
decrement()方法这个导致发生竞态条件的代码区被称为临界区
避免这种问题,需要保证读取-修改-写入这样复合操作的原子性
在 Java 中,有很多方式可以实现,比如使用 synchronize 内置锁或 ReentrantLock 显式锁的加锁机制、使用线程安全的原子类、以及采用 CAS 的方式等
活跃性问题
活跃性问题指的是,某个操作因为阻塞或循环,无法继续执行下去
最典型的有三种,分别为死锁、活锁和饥饿
死锁
最常见的活跃性问题是死锁
死锁是指多个线程之间相互等待获取对方的锁,又不会释放自己占有的锁,而导致阻塞使得这些线程无法运行下去就是死锁,它往往是不正确的使用加锁机制以及线程间执行顺序的不可预料性引起的
如何预防死锁
1.尽量保证加锁顺序是一样的
例如有 A,B,C 三把锁。
Thread 1 的加锁顺序为 A、B、C 这样的。
Thread 2 的加锁顺序为 A、C,这样就不会死锁。
如果 Thread2 的加锁顺序为 B、A 或者 C、A 这样顺序就不一致了,就会出现死锁问题。
2.尽量用超时放弃机制
Lock 接口提供了 tryLock(long time, TimeUnit unit)方法,该方法可以按照固定时长等待锁,因此线程可以在获取锁超时以后,主动释放之前已经获得的所有的锁。可以避免死锁问题
活锁
活锁与死锁非常相似,也是程序一直等不到结果,但对比于死锁,活锁是活的,什么意思呢?因为正在运行的线程并没有阻塞,它始终在运行中,却一直得不到结果
饥饿
饥饿是指线程需要某些资源时始终得不到,尤其是 CPU 资源,就会导致线程一直不能运行而产生的问题。
在 Java 中有线程优先级的概念,Java 中优先级分为 1 到 10,1 最低,10 最高。
如果我们把某个线程的优先级设置为 1,这是最低的优先级,在这种情况下,这个线程就有可能始终分配不到 CPU 资源,而导致长时间无法运行。
性能问题
线程本身的创建、以及线程之间的切换都要消耗资源,如果频繁的创建线程或者 CPU 在线程调度花费的时间远大于线程运行的时间,使用线程反而得不偿失,甚至造成 CPU 负载过高或者 OOM 的后果
举例说明
线程不安全类
案例 1
使用线程不安全集合(ArrayList、HashMap 等)要进行同步,最好使用线程安全的并发集合
在多线程环境下,对线程不安全的集合遍历进行操作时,可能会抛出 ConcurrentModificationException 的异常,也就是常说的 fail-fast 机制
下面例子模拟了多个线程同时对 ArrayList 操作,线程 t1 遍历 list 并打印,线程 t2 向 list 添加元素
进到抛异常的 ArrayList 源码中,可以看到遍历 ArrayList 是通过内部实现的迭代器完成的
调用迭代器的 next()方法获取下一个元素时,会先通过 checkForComodification()方法检查 modCount 和 expectedModCount 是否相等,若不相等则抛出 ConcurrentModificationException
modCount 是 ArrayList 的属性,表示集合结构被修改的次数(列表长度发生变化的次数),每次调用 add 或 remove 等方法都会使 modCount 加 1
expectedModCount 是迭代器的属性,在迭代器实例创建时被赋与和遍历前 modCount 相等的值(expectedModCount=modCount)
所以当有其他线程添加或删除集合元素时,modCount 会增加,然后集合遍历时 expectedModCount 不等于 modCount,就会抛出异常
使用加锁机制操作线程不安全的集合类
如上面代码,用 synchronized 关键字锁住对 list 的操作,就不会抛出异常。不过用 synchronized 相当于把锁住的代码块串行化,性能上是不占优势的
推荐使用线程安全的并发工具类
JDK1.5 加入了很多线程安全的工具类供使用,如 CopyOnWriteArrayList、ConcurrentHashMap 等并发容器
日常开发中推荐使用这些工具类来实现多线程编程
案例 2
不要将 SimpleDateFormat 作为全局变量使用
SimpleDateFormat 实际上是一个线程不安全的类,其根本原因是 SimpleDateFormat 的内部实现对一些共享变量的操作没有进行同步
建议将 SimpleDateFormat 作为局部变量使用,或者配合 ThreadLocal 使用
最简单的做法是将 SimpleDateFormat 作为局部变量使用即可
但如果是在 for 循环中使用,会创建很多实例,可以优化下配合 ThreadLocal 使用
推荐使用 Java8 的 LocalDateTime 和 DateTimeFormatter
LocalDateTime 和 DateTimeFormatter 是 Java 8 引入的新特性,它们不仅是线程安全的,而且使用更方便
推荐在实际开发中用 LocalDateTime 和 DateTimeFormatter 替代 Calendar 和 SimpleDateFormat
锁的正确释放
假设有这样一段伪代码:
这段代码中在 finally 代码块释放锁之前,执行了一段业务逻辑
假如不巧这段逻辑中依赖服务不可用导致占用锁的线程不能成功释放锁,会造成其他线程因无法获取锁而阻塞,最终线程池被打满的问题
所以在释放锁之前;finally 子句中应该只有对当前线程占有的资源(如锁、IO 流等)进行释放的一些处理
还有就是获取锁时设置合理的超时时间
为了避免线程因获取不到锁而一直阻塞,可以设置一个超时时间,当获取锁超时后,线程可以抛出异常或返回一个错误的状态码。其中超时时间的设置也要合理,不应过长,并且应该大于锁住的业务逻辑的执行时间。
正确使用线程池
案例 1
不要将线程池作为局部变量使用
在 for 循环中创建线程池,那么每次执行该方法时,入参的 list 长度有多大就会创建多少个线程池,并且方法执行完后也没有及时调用 shutdown()方法将线程池销毁
这样的话,随着不断有请求进来,线程池占用的内存会越来越多,就会导致频繁 fullGC 甚至 OOM。每次方法调用都创建线程池是很不合理的,因为这和自己频繁创建、销毁线程没有区别,不仅没有利用线程池的优势,反而还会耗费线程池所需的更多资源
所以尽量将线程池作为全局变量使用
案例 2
谨慎使用默认的线程池静态方法
上述三个默认线程池的风险点:
newFixedThreadPool 创建的线程池 corePoolSize 和 maximumPoolSize 值是相等的,使用的阻塞队列是 LinkedBlockingQueue。
newSingleThreadExecutor 将 corePoolSize 和 maximumPoolSize 都设置为 1,也使用的 LinkedBlockingQueue
LinkedBlockingQueue 默认容量为 Integer.MAX_VALUE=2147483647,对于真正的机器来说,可以被认为是无界队列
newFixedThreadPool 和 newSingleThreadExecutor 在运行的线程数超过 corePoolSize 时,后来的请求会都被放到阻塞队列中等待,因为阻塞队列设置的过大,后来请求不能快速失败而长时间阻塞,就可能造成请求端的线程池被打满,拖垮整个服务。
newCachedThreadPool 将 corePoolSize 设置为 0,将 maximumPoolSize 设置为 Integer.MAX_VALUE,阻塞队列使用的 SynchronousQueue,SynchronousQueue 不会保存等待执行的任务
所以 newCachedThreadPool 是来了任务就创建线程运行,而 maximumPoolSize 相当于无限的设置,使得创建的线程数可能会将机器内存占满。
所以需要根据自身业务和硬件配置创建自定义线程池
线程数建议
线程池 corePoolSize 数量设置建议:
1.CPU 密集型应用
CPU 密集的意思是任务需要进行大量复杂的运算,几乎没有阻塞,需要 CPU 长时间高速运行。
一般公式:corePoolSize=CPU 核数+1 个线程。JVM 可运行的 CPU 核数可以通过 Runtime.getRuntime().availableProcessors()查看。
2.IO 密集型应用
IO 密集型任务会涉及到很多的磁盘读写或网络传输,线程花费更多的时间在 IO 阻塞上,而不是 CPU 运算。一般的业务应用都属于 IO 密集型。
参考公式:最佳线程数=CPU 数/(1-阻塞系数); 阻塞系数=线程等待时间/(线程等待时间+CPU 处理时间) 。
IO 密集型任务的 CPU 处理时间往往远小于线程等待时间,所以阻塞系数一般认为在 0.8-0.9 之间,以 4 核单槽 CPU 为例,corePoolSize 可设置为 4/(1-0.9)=40。当然具体的设置还是要根据机器实际运行中的各项指标而定
最后
写文章画图不易,喜欢的话,希望帮忙点赞,转发下哈,谢谢
参考书籍:
Java 并发编程实战;如果大家想要获取这份资料的话 添加小助理 vx:mxzFAFAFA 来获取!!
原文链接:https://juejin.cn/post/6950933916245049351
版权声明: 本文为 InfoQ 作者【学Java关注我】的原创文章。
原文链接:【http://xie.infoq.cn/article/30316e545a610ee0efc64c1c0】。文章转载请联系作者。
评论