Disruptor—并发编程相关简介
1.并发类容器
(1)ConcurrentMap
ConcurrentMap 是 Map 的子接口,是高并发下线程安全的 Map 集合。ConcurrentMap 有两个实现类:
ConcurrentHashMap 采取了分段锁的技术来细化锁的粒度,把整个 Map 划分为一系列 Segment 的组成单元,一个 Segment 相当于一个小的 HashTable。
ConcurrentSkipListMap 的底层是通过跳表来实现的,跳表是一个链表,其插入、读取数据的复杂度为 O(logn)。
(2)CopyOnWrite 容器
CopyOnWrite 容器即写时复制的容器。当我们往一个容器中添加元素时,不直接往容器中添加,而是将当前容器进行 copy,复制出来一个新的容器。然后向新容器中添加需要的元素,最后将原容器的引用指向新容器。这样做的好处是:可在并发场景下对容器进行读操作而无需加锁,从而实现读写分离。
Java 并发包里提供了两个使用 CopyOnWrite 机制实现的并发容器,分别是 CopyOnWriteArrayList 和 CopyOnWriteArraySet。CopyOnWrite 容器适用于读多写少 + 元素不会特别多的场景。
(3)ArrayBlockingQueue
ArrayBlockingQueue 是最典型的有界阻塞队列,其内部是用数组存储元素的,初始化时需要指定容量大小,利用 ReentrantLock 实现线程安全。
(4)LinkedBlockingQueue
LinkedBlockingQueue 是一个基于链表实现的阻塞队列。默认情况下,该阻塞队列的大小为 Integer.MAX_VALUE。由于这个数值特别大,所以 LinkedBlockingQueue 也被称作无界队列,代表它几乎没有界限,队列可以随着元素的添加而动态增长。但是如果没有剩余内存,则队列将抛出 OOM 错误。所以为了避免队列过大造成机器负载或者内存爆满的情况出现,在使用 LinkedBlockingQueue 时建议手动传一个队列的大小。
LinkedBlockingQueue 内部由单链表实现,只能从 head 取元素,从 tail 添加元素。并且采用两把锁的锁分离技术实现入队出队互不阻塞,添加元素和获取元素都有独立的锁。也就是说 LinkedBlockingQueue 是读写分离的,读写操作可以并行执行。
(5)SynchronousQueue
SynchronousQueue 是无缓冲阻塞队列,用来在两个线程之间移交元素。它并不是真正的队列,不维护存储空间,而维护一组线程,这些线程在等待放入或移出元素。
SynchronousQueue 是一种极为特殊的阻塞队列,它没有实际的容量。任意线程都会等待获取到数据或者交付完数据才会返回,这里任意线程指的是生产者线程或者消费者线程。生产类型的操作比如 put、offer,消费类型的操作比如 poll、take。一个生产者线程的使命是将线程中的数据交付给另一个消费者线程,而一个消费者线程则是等待一个生产者线程中的数据。
(6)PriorityBlockingQueue
PriorityBlockingQueue 是带优先级的无界阻塞队列,每次出队都返回优先级最好或最低的元素,内部是平衡二叉树的实现。
(7)DelayQueue
DelayQueue 是一个无界阻塞队列,用于放置实现了 Delayed 接口的对象,其中的对象只能在其到期时才能从队列中取走。这种队列是有序的,即队头对象的延迟到期时间最长,注意不能将 null 元素放置到这种队列中。
2.volatile 关键字与内存分析
(1)volatile 关键字的作用
作用一:多线程间的可见性
作用二:阻止指令重排序
那些支持热部署、支持动态更新的框架会大量使用 volatile 关键字。此外,ZooKeeper 的 Watcher 机制也可以支持对配置的动态感知。
(2)volatile 的内存分析

3.Atomic 系列类与 UnSafe 类
(1)Atomic 与 UnSafe 类的关系
Atomic 系列类提供了原子性操作,保证了多线程下的并发安全,Atomic 底层是通过调用 UnSafe 类的 CAS 方法来实现原子性操作的。
由于 UnSafe 类可以直接访问操作系统底层硬件,而 Java 没办法直接访问操作系统底层,所以需借助 UnSafe 类来实现 CAS。
(2)UnSafe 类的四大作用
作用一:进行内存操作,比如 UnSafe 类的 allocateMemory()和 freeMemory()方法等。
作用二:字段的定位与修改,比如 UnSafe 类的 getInt()和 putInt()方法等。
作用三:挂起与恢复线程,比如 JDK 的 LockSupport 类,会通过 UnSafe 类的 park()和 unpark()方法实现挂起和恢复线程。
作用四:CAS 操作(乐观锁),比如 UnSafe 类的 compareAndSwapObject()系列方法就实现了 CAS 操作。
4.JUC 常用工具类
(1)CountDownLatch 和 CyclieBarrier
CountDownLatch 主要是阻塞一个线程,即阻塞当前的线程,然后调用 countdown()方法减到 0 时就会唤醒阻塞的当前线程。
CountDownLatch 和 CyclicBarrier 的区别:CountDownLatch 是一次的阻塞、一个线程的阻塞。比如 new 一个 CountDownLatch 时设置为 3,当前线程调用 await()方法被阻塞,那么必须有线程总共调用 3 次 countdown()方法,当前线程才能继续往下执行。
CyclieBarrier 也可以设置一个阈值,比如这个阈值设置为 5。有 5 个线程都调用 await()方法,当这 5 个线程全部准备就绪后才一起往下。
(2)Future 模式与 Callable 接口
Future 模式用于让当前线程异步去提交工作,然后进行等待,等到负责异步回调的线程真正执行完之后,当前线程通过调用 get()方法就能获取到数据。
(3)Exchanger 线程数据交换器
Exchanger 可以实现两个线程间的数据的交换,Exchanger 通常用于一些对账场景。比如线程 A 和线程 B 同时接收同样的数据,进行磁盘 IO 读写等操作。线程 A 和线程 B 执行完都有一个结果,可通过 Exchanger 对比结果是否一致。
(4)ForkJoin 并行计算
ForkJoin 的核心就是通过递归拆分将一个大任务拆分成若干的小任务,然后对这些拆分的小任务进行并行计算,接着通过 join()整合计算结果,最后计算出统计的结果。
(5)Semaphore 信号量
Semaphore 可以控制能够同时进行并发访问的线程数量,比如设置了 Semaphore 最多允许 5 个线程可以并发进行访问。如果出现 20 个线程,那么会有 15 个线程进入 Semaphore 的 AQS 对列。
5.AQS 各种锁与架构核心
(1)ReentrantLock 重入锁
ReentrantLock 是基于 AQS 的,AQS 的两大核心:一是共享变量 state,二是 CLH 等待队列。重入指的是同一个线程可以反复获得这个 ReentrantLock。
Object 锁要配合 Synchronized + wait() + notify()来实现线程间的阻塞唤醒,而且需要注意的是:wait()方法会释放锁,notify()方法不会释放锁。
ReentrantLock 可以通过 Condition 来实现线程间的阻塞和唤醒,比如使用 Condition 的 await()方法和 signal()方法,而且需要注意的是:await()方法会释放锁,signal()方法不会释放锁。
(2)ReentrantReadWriteLock 读写锁
ReentrantReadWriteLock 也是基于 AQS 的,可以实现读写分离。
(3)Condition 条件判断
Condition 条件判断是配合 ReentrantLock 或者 ReentrantReadWriteLock 使用的,可以使用类似于 Synchronized 锁下的 wait()方法和 notify()方法进行线程阻塞与唤醒。
(4)LookSupport 基于线程的锁
LookSupport 有两个关键的方法:park()和 unpark()。LookSupport 的这两个方法会调用 UnSafe 类中的 park()和 unpark()方法,分别用来挂起指定线程和唤醒指定线程。
注意:LookSupport 唤醒和挂起线程的顺序并没有先后关系,也就是对于同一个线程,先执行 unpark()再执行 park()也不会影响。
(5)AQS 架构简介
一.AQS 维护了一个 state 和一个线程等待队列
其中 volatile int state 代表着共享资源,多线程争用资源被阻塞时会进入一个 FIFO 线程等待队列。
二.AQS 定义了独占和共享两种资源处理方式
比如 ReentrantLock 使用的是 Exclusive 独占的方式,Semaphore 使用的是 Share 共享的方式。
三.AQS 的核心方法
isHeldExclusively()方法:
判断线程是否正在独占资源。
tryAcquire()和 tryRelease()方法:
表示以独占的方式尝试获取和释放资源。
tryAcquireShared()和 tryReleaseShared()方法:
表示以共享的方式尝试获取和释放资源。
(6)ReentrantLock 底层原理简介
首先 state 会初始化为 0,表示未锁定状态。当线程 A 调用 ReentrantLock 的 lock()方法时,会触发调用 tryAcquire()方法以独占方式获取锁并将 state + 1。此后其他线程调用 tryAcquire()方法时就会失败,直到线程 A 调用 ReentrantLock 的 unlock()方法释放锁(将 state 减为 0)为止。线程 A 在释放锁之前,可以重复获取锁,重复获取锁时,state 会累加,这就是可重入的原理。但获取锁多少次(重入锁多少次/state 累加了多少次),就要释放锁多少次,这样才能保证 state 能回到初始值为 0 的时候。
(7)CountDownLatch 底层原理简介
如果任务分为 N 个子线程去执行,那么 state 会初始化为 N。这 N 个子线程是并行执行的,每个子线程执行完就会 countdown()一次。每 countdown()一次,state 就会通过 CAS 减 1。等所有子线程都执行完后(即 state=0),会调用 unpark()方法唤醒线程,然后主线程从 await()方法中返回,继续后面的处理。
6.线程池的最佳使用指南
(1)Excutors 工厂类
Excutors 提供了很多方法,比如 newFixedThreadPool()等。但是不建议使用 Excutors 工厂类里的创建线程池方法,因为这些创建线程池的方法里很多都没有界限限制的,存在安全隐患。比如使用 newFixedThreadPool()方法创建线程池时,没有限制阻塞队列长度。比如使用 newCachedThreadPool()方法创建线程池时,没有限制线程数量。
(2)ThreadPoolExecutor 自定义线程池
(3)如何确定线程池的线程数量
一.计算密集型
一般来说,计算密集型的一个线程执行比较快,线程数 = CPU 核数 + 1 或 CPU 核数 * 2。
二.IO 密集型
一般来说,IO 密集型的一个线程执行比较慢,线程数 = CPU 核数 / (1 - 阻塞系数),其中阻塞系数一般是 0.8 或 0.9。
一个应用服务的线程池一定要统一起来进行管理,创建新的线程池的时候,需要知道当前应用系统运行时究竟会使用多少线程。
(4)如何正确使用线程池
一.注意线程池的相关配置
比如线程数量、阻塞队列的大小等。注意:newFixedThreadPool()方法创建线程池时不会限制阻塞队列长度,newCachedThreadPool()方法创建线程池时不会限制线程数量。
二.利用 hook 嵌入线程的行为
ThreadPoolExecutor 中有 beforeExecute()方法和 afterExecute()方法,因此可以在某一个线程执行前和执行后输出一些关键的日志。这样在线程运行失败时,便可以进行更加详细的分析。
三.需要优雅关闭线程池
一般为了避免线程池没有合理关闭,都推荐使用 Spring 创建线程池,然后直接在执行 destroy()方法进行销毁时调用 shutdown()方法即可。从而确保服务关闭时,线程池也被关闭掉。
文章转载自:东阳马生架构
评论