写点什么

史上最全的 Java 并发系列之 Java 并发容器和框架

作者:自然
  • 2022 年 8 月 15 日
    广东
  • 本文字数:6102 字

    阅读完需:约 20 分钟

前言

文本已收录至我的 GitHub 仓库,欢迎 Star:https://github.com/bin392328206/six-finger

种一棵树最好的时间是十年前,其次是现在

我知道很多人不玩 qq 了,但是怀旧一下,欢迎加入六脉神剑 Java 菜鸟学习群,群聊号码:549684836 鼓励大家在技术的路上写博客

ConcurrentHashMap

这个呢,我在前面集合容器有讲到,链接在下面


🔥史上最全的Java容器集合之ConcurrentHashMap(源码解读)


大家有兴趣的去看看

ConcureentLinkedQueue

在并发编程中,有时候需要使用线程安全的队列。


如果要实现一个线程安全的队列有两种方式:


  • 使用阻塞算法:使用阻塞算法的队列可以用一个锁(入队和出队用同一把锁)或两个锁(入队和出队用不同的锁)等方式来实现。

  • 使用非阻塞算法:非阻塞的实现方式则可以使用循环 CAS 的方式来实现。


ConcurrentLinkedQueue 是一个基于链接节点的无界线程安全队列,它采用 FIFO 的规则对节点进行排序,当我们添加一个元素的时候,它会添加到队列的尾部;当我们获取一个元素时,它会返回队列头部的元素。它采用了“wait-free”算法(即 CAS 算法)来实现,该算法在 Michael&Scott 算法上进行了一些修改。



ConcurrentLinkedQueue 由 head 节点和 tail 节点组成,每个节点 Node 由节点元素 item 和指向下一个节点 next 的引用组成,节点与节点之间就是通过这个 next 关联起来,从而组成一张链表结构的队列。

入队列

入队列就是将入队节点添加到队列的尾部。



  • 添加元素 1:队列更新 head 节点的 next 节点为元素 1 节点。又因为 tail 节点默认情况下等于 head 节点,所以它们的 next 节点都指向元素 1 节点。

  • 添加元素 2:队列首先设置元素 1 节点的 next 节点为元素 2 节点,然后更新 tail 节点指向元素 2 节点。

  • 添加元素 3:设置 tail 节点的 next 节点为元素 3 节点。

  • 添加元素 4:设置元素 3 的 next 节点为元素 4 节点,然后将 tail 节点指向元素 4 节点。


通过上图我们发现,入队主要做两件事情:


  • 将入队节点设置成当前队列尾节点的下一个节点

  • 更新 tail 节点,如果 tail 节点的 next 节点不为空,则将入队节点设置成 tail 节点,如果 tail 节点的 next 节点为空,则将入队节点设置成 tail 的 next 节点,所以 tail 节点不总是尾节点

  • 以下是入队列的源码:


public boolean add(E e) {    return offer(e);}public boolean offer(E e) {    final Node<E> newNode = newNode(Objects.requireNonNull(e));    for (Node<E> t = tail, p = t;;) {        Node<E> q = p.next;        if (q == null) {            // p is last node            if (casNext(p, null, newNode)) {                if (p != t) // hop two nodes at a time                    casTail(t, newNode);  // Failure is OK.                return true;            }        }        else if (p == q)            p = (t != (t = tail)) ? t : head;        else            // Check for tail updates after two hops.            p = (p != t && t != (t = tail)) ? t : q;    }}
复制代码


  • 构建了一个新的节点 newNode

  • 如果 tail 节点的 next 节点为空,则通过 CAS 将 newNode 设置为 tail 的 next 节点,设置成功之后,在更新 tail 为 newNode 节点。

  • 否则继续重试上一步

出队列

出队列的就是从队列里返回一个节点元素,并清空该节点对元素的引用



以下是出队列的源码:


public E poll() {    restartFromHead:    for (;;) {        for (Node<E> h = head, p = h, q;;) {            E item = p.item;            if (item != null && casItem(p, item, null)) {                if (p != h) // hop two nodes at a time                    updateHead(h, ((q = p.next) != null) ? q : p);                return item;            }            else if ((q = p.next) == null) {                updateHead(h, p);                return null;            }            else if (p == q)                continue restartFromHead;            else                p = q;        }    }}
复制代码


首先获取 head 节点的元素 item,然后判断是否为空?


  • 如果为空,表示另外一个线程已经进行了一次出队操作将该节点的元素取走。

  • 如果不为空,则使用 CAS 的方式将头节点的引用设置成 null,如果 CAS 成功,则直接返回头节点的元素 item,如果不成功,表示另外一个线程已经进行了一次出队操作更新了 head 节点,导致元素发生了变化,需要重新获取头节点。

Java 中的阻塞队列

什么是阻塞队列

阻塞队列(BlockingQueue)是一个支持以下两个附加操作的队列:


  • 支持阻塞的插入方法:当队列满时,队列会阻塞插入元素的线程,直到队列不满。

  • 支持阻塞的移除方法:在队列为空时,获取元素的线程会等待队列变为非空。


阻塞队列常用于生产者和消费者的场景,生产者是向队列里添加元素的线程,消费者是从队列里取元素的线程。阻塞队列就是生产者用来存放元素、消费者用来获取元素的容器


在阻塞队列不可用时,这两个附加操作提供了以下 4 种处理方式:



  • 抛出异常:队列满时,再添加元素,会抛出 IllegalStateException("Queue full")异常;当队列为空时,从队列里获取元素会抛出 NoSuchElementException 异常。

  • 返回特殊值:往队列插入元素时,返回 ture 表示插入成功。从队列里移除元素,即取出元素,如果没有则返回 null。

  • 一直阻塞:当阻塞队列满时,如果生产者线程往队列里 put 元素,队列会一直阻塞生产者线程,直到队列可用或者响应中断退出。当队列空时,如果消费者线程从队列里 take 元素,队列会阻塞住消费者线程,直到队列不为空。

  • 超时退出:当阻塞队列满时,如果生产者线程往队列里插入元素,队列会阻塞生产者线程一段时间,如果超过了指定的时间 time,生产者线程就会退出。


如果是无界阻塞队列,队列不可能会出现满的情况,所以使用 put 或 offer 方法永远不会被阻塞,而且使用 offer 方法时,该方法永远返回 true。

Java 里的阻塞队列

  • ArrayBlockingQueue:一个由 数组 结构组成的 有界 阻塞队列。

  • 按照 FIFO 的原则对元素进行排序 。

  • 默认情况下不保证线程公平的访问队列。

  • 公平访问 队列是指阻塞的线程,可以 按照阻塞的先后顺序访问队列,即先阻塞线程先访问队列。

  • 非公平性是对先等待的线程是非公平的,当队列可用时,阻塞的线程都有争夺访问队列的资格,有可能先阻塞的线程最后才访问队列。


为了保证公平性,通常会降低吞吐量。我们可以使用以下代码创建一个公平的阻塞队列:


ArrayBlockingQueue fairQueue = new ArrayBlockingQueue(1000,true);
public ArrayBlockingQueue(int capacity, boolean fair) { if (capacity <= 0) throw new IllegalArgumentException(); this.items = new Object[capacity]; lock = new ReentrantLock(fair); notEmpty = lock.newCondition(); notFull = lock.newCondition();}
复制代码


  • LinkedBlockingQueue:一个由 链表 结构组成的 有界 阻塞队列。此队列的默认和最大长度为 Integer.MAX_VALUE。此队列按照 FIFO 的原则对元素进行排序。

  • DelayQueue:一个使用优先级队列实现的 无界 阻塞队列。DelayQueue 是一个支持 延时获取元素 的 无界 阻塞队列。队列使用 PriorityQueue 来实现。队列中的元素必须实现 Delayed 接口,在创建元素时可以指定多久才能从队列中获取当前元素。只有在延迟期满时才能从队列中提取元素。可以将 DelayQueue 运用在以下应用场景:

  • 缓存系统的设计:可以用 DelayQueue 保存缓存元素的有效期,使用一个线程循环查询 DelayQueue,一旦能从 DelayQueue 中获取元素时,表示缓存有效期到了。

  • 定时任务调度:使用 DelayQueue 保存当天将会执行的任务和执行时间,一旦从 DelayQueue 中获取到任务就开始执行,比如 TimerQueue 就是使用 DelayQueue 实现的。

  • LinkedBlockingDeque:一个由 链表 结构组成的 双向 阻塞队列。所谓双向队列指的是可以从队列的两端插入和移出元素。双向队列因为多了一个操作队列的入口,在多线程同时入队时,也就减少了一半的竞争。相比其他的阻塞队列,LinkedBlockingDeque 多了 addFirst、addLast、offerFirst、offerLast、peekFirst 和 peekLast 等方法。以 First 单词结尾的方法,表示插入、获取(peek)或移除双端队列的 第一个元素。以 Last 单词结尾的方法,表示插入、获取或移除双端队列的 最后一个元素。

阻塞队列的实现原理

即为使用 通知模式 实现。就是当生产者往满的队列里添加元素时会阻塞住生产者,当消费者消费了一个队列中的元素后,会通知生产者当前队列可用。


以下是 ArrayBlockingQueue 的相关代码,我们可以看到它是用 Condition 来实现的:


public ArrayBlockingQueue(int capacity, boolean fair) {    ...    notEmpty = lock.newCondition();    notFull =  lock.newCondition();}public void put(E e) throws InterruptedException {    Objects.requireNonNull(e);    final ReentrantLock lock = this.lock;    lock.lockInterruptibly();    try {        while (count == items.length)            notFull.await();        enqueue(e);    } finally {        lock.unlock();    }}public E take() throws InterruptedException {    final ReentrantLock lock = this.lock;    lock.lockInterruptibly();    try {        while (count == 0)            notEmpty.await();        return dequeue();    } finally {        lock.unlock();    }}private void enqueue(E x) {    // assert lock.getHoldCount() == 1;    // assert items[putIndex] == null;    final Object[] items = this.items;    items[putIndex] = x;    if (++putIndex == items.length) putIndex = 0;    count++;    notEmpty.signal();}private E dequeue() {    // assert lock.getHoldCount() == 1;    // assert items[takeIndex] != null;    final Object[] items = this.items;    @SuppressWarnings("unchecked")    E x = (E) items[takeIndex];    items[takeIndex] = null;    if (++takeIndex == items.length) takeIndex = 0;    count--;    if (itrs != null)        itrs.elementDequeued();    notFull.signal();    return x;}
复制代码

Fork / Join 框架

Fork/Join 框架是 Java 7 提供的一个用于并行执行任务的框架,是一个 把大任务分割成若干个小任务,最终汇总每个小任务结果后得到大任务结果 的框架。


比如计算 1+2+…+10000;可以分割成 10 个子任务,每个子任务分别对 1000 个数进行求和,最终汇总这 10 个子任务的结果。



工作窃取算法


工作窃取(work-stealing)算法是指某个线程从其他队列里窃取任务来执行。比如 我们把一个大任务分成 10 个小任务 让 10 个线程分别执行一个任务,可能线程 1 执行的任务很快就完成了,线程 2 执行的比较慢,这时候线程 1 就可以去线程 2 的任务队列里面去取任务来继续工作,以提高效率。



工作窃取算法的优缺点:


  • 优点:充分利用线程进行并行计算,减少了线程间的竞争。

  • 缺点:在某些情况下还是存在竞争,比如双端队列里只有一个任务时。并且该算法会消耗了更多的系统资源,比如创建多个线程和多个双端队列。

Fork/Join 框架的设计

  • 分割任务


  • 执行任务并合并结果


Fork/Join 使用以下两个类来完成以上两件事情:


  • ForkJoinTask 我们要使用 ForkJoin 框架,必须首先创建一个 ForkJoin 任务。

  • 它提供在任务中执行 fork()和 join()操作的机制。

  • 通常情况下,我们不需要直接继承 ForkJoinTask 类,只需要继承它的子类,Fork/Join 框架提供了以下两个子类:

  • RecursiveAction :用于没有返回结果的任务。

  • RecursiveTask:用于有返回结果的任务。

  • ForkJoinPool

  • ForkJoinTask 需要通过 ForkJoinPool 来执行。


任务分割出的子任务会添加到当前工作线程所维护的双端队列中,进入队列的头部。当一个工作线程的队列里暂时没有任务时,它会随机从其他工作线程的队列的尾部获取一个任务。

使用 Fork/Join 框架

以下示例为使用 Fork/Join 框架计算 1+2+3+4 ,设置的分割的阈值是 2,即 1+2+3+4 会被分割为 1+2 和 3+4 两个任务,因为有返回结果,所以我们需要使用 RecursiceTask:


public class TestRecursiveTask extends RecursiveTask<Integer> {
/** * 阈值 */ private static final int THRESHOLD = 2; private int start; private int end;
public TestRecursiveTask(int start, int end) { this.start = start; this.end = end; }
public static void main(String[] args) { ForkJoinPool forkJoinPool = new ForkJoinPool(); // 生成一个计算任务,负责计算1+2+3+4 TestRecursiveTask task = new TestRecursiveTask(1, 4); // 执行一个任务 Future<Integer> result = forkJoinPool.submit(task); try { System.out.println(result.get()); } catch (Exception e) { e.printStackTrace(); } }
@Override protected Integer compute() { int sum = 0; // 如果任务足够小就计算任务 boolean canCompute = (end - start) <= THRESHOLD; System.out.println(start + "---" + end); if (canCompute) { for (int i = start; i <= end; i++) { sum += i; } } else { // 如果任务大于阈值,就分裂成两个子任务计算 int middle = (start + end) / 2; TestRecursiveTask leftTask = new TestRecursiveTask(start, middle); TestRecursiveTask rightTask = new TestRecursiveTask(middle + 1, end); // 执行子任务 leftTask.fork(); rightTask.fork(); // 等待子任务执行完,并得到其结果 int leftResult = leftTask.join(); int rightResult = rightTask.join(); // 合并子任务 sum = leftResult + rightResult; } return sum; }}//1---4//1---2//3---4//10
复制代码


通过这个例子,我们进一步了解 ForkJoinTask,ForkJoinTask 与一般任务的主要区别在于它需要实现 compute 方法,在这个方法里,首先需要判断任务是否足够小,如果足够小就直接执行任务。如果不足够小,就必须分割成两个子任务,每个子任务在调用 fork 方法时,又会进入 compute 方法,看看当前子任务是否需要继续分割成子任务,如果不需要继续分割,则执行当前子任务并返回结果。使用 join 方法会等待子任务执行完并得到其结果。

结尾

因为很多东西,全是从书上拷贝的,很枯燥,但同时看书,又是最详细的学习方法之一了,大家跟着书看博客,或许会好点吧.


因为博主也是一个开发萌新 我也是一边学一边写 我有个目标就是一周 二到三篇 希望能坚持个一年吧 希望各位大佬多提意见,让我多学习,一起进步。

日常求赞

好了各位,以上就是这篇文章的全部内容了,能看到这里的人呀,都是真粉


创作不易,各位的支持和认可,就是我创作的最大动力,我们下篇文章见


六脉神剑 | 文 【原创】如果本篇博客有任何错误,请批评指教,不胜感激 !

发布于: 刚刚阅读数: 3
用户头像

自然

关注

还未添加个人签名 2020.03.01 加入

小六六,目前负责营收超百亿的支付中台

评论

发布
暂无评论
史上最全的Java并发系列之Java并发容器和框架_多线程_自然_InfoQ写作社区