写点什么

重新学习 Java 线程原语

作者:码语者
  • 2023-04-20
    上海
  • 本文字数:3875 字

    阅读完需:约 13 分钟

重新学习Java线程原语

Synchronized 曾经是一个革命性的技术,在当前仍然有重要的用途。但是,现在是时候转向更新的 Java 线程原语,同时重新考虑我们的核心逻辑。

自从 Java 第一个测试版以来,我就一直在使用它。从那时起,线程就是我最喜欢的特性之一。Java 是第一种在编程语言本身中引入线程支持的语言。那是一个具有争议的决定。在过去的十年中,每种编程语言都竞相引入 async/await,甚至Java也有一些第三方支持......但是 Java 选择了引入更优越的虚拟线程(Loom项目)。本文并不讨论这个问题。

我觉得这很好,证明了 Java 的核心实力。Java 不仅仅是一种语言,还是一种文化。这种文化注重深思熟虑的变革,而不是盲目跟随时尚潮流。

 在本文中,我想重新探讨 Java 中的线程编程旧方法。我习惯使用 synchronized、wait、notify 等技术。但是, “然而,这些方法已经不再是 Java 中线程处理的最佳方式。 我也是问题的一部分。我还是习惯于使用这些技术,发现很难适应自 Java 5 以来就存在的一些 API。这是一种习惯的力量。 虽然可以讨论许多处理线程的出色 API,但我想在这里专注讨论锁,因为它们是基础但极为重要的。

Synchronized 与 ReentrantLock

我犹豫放弃使用 synchronized 的原因是,并没有更好的替代方案。现在弃用 synchronized 的主要原因是,它可能会在 Loom 中触发线程固定,这并不理想。JDK 21 可能会修复这个问题(当 Loom 正式发布时),但还有一些理由弃用它。

synchronized 的直接替代品是 ReentrantLock。不幸的是,ReentrantLock 相比 synchronized 很少有优势,因此迁移的好处最多是存疑的。事实上,它有一个主要的缺点。为了了解这一点,让我们看一个例子。下面是我们如何使用 synchronized:


synchronized(LOCK) {
    // safe code
}
LOCK.lock();
try {
    // safe code
} finally {
    LOCK.unlock();
}
复制代码

ReentrantLock 的第一个缺点是冗长。我们需要 try 块,因为如果在块内部发生异常,锁将保持。而 synchronized 则会自动处理异常。

有些人会使用 AutoClosable 对锁进行封装,大概是这样的:

public class ClosableLock implements AutoCloseable {
   private final ReentrantLock lock;
   public ClosableLock() {
       this.lock = new ReentrantLock();
   }
   public ClosableLock(boolean fair) {
       this.lock = new ReentrantLock(fair);
   }
   @Override
   public void close() throws Exception {
       lock.unlock();
   }
   public ClosableLock lock() {
       lock.lock();
       return this;
   }
   public ClosableLock lockInterruptibly() throws InterruptedException {
       lock.lock();
       return this;
   }
   public void unlock() {
       lock.unlock();
   }
}
复制代码


注意,我没有实现 Lock 接口,这本来是最理想的。这是因为 lock 方法返回了可自动关闭的实现,而不是 void。

一旦我们这样做了,我们就可以编写更简洁的代码,比如这样:

try(LOCK.lock()) {
    // safe code
}
复制代码

我喜欢代码更简洁的写法,但是这个方法存在一些问题,因为 try-with-resource 语句是用于清理资源的,而我们正在重复使用锁对象。虽然调用了 close 方法,但是我们会再次在同一个对象上调用它。我认为,将 try-with-resource 语法扩展到支持锁接口可能是个好主意。但在此之前,这个技巧可能不值得采用。

ReentrantLock 的优势

使用 ReentrantLock 的最大原因是 Loom 支持。其他的优点也不错,但没有一个是“杀手级功能”。

我们可以在方法之间使用它,而不是在一个连续的代码块中使用。但是这可能不是一个好主意,因为你希望尽量减少锁定区域,并且失败可能会成为一个问题。我不认为这个特性是一个优点。

ReentrantLock 提供了公平锁(fairness)的选项。这意味着它会先服务于最先停在锁上的线程。我试图想到一个现实而简单的使用案例,但却无从下手。如果您正在编写一个复杂的调度程序,并且有许多线程不断地排队等待资源,您可能会发现一个线程由于其他线程不断到来而被“饥饿”。但是,这种情况可能更适合使用并发包中的其他选项。也许我漏掉了什么……

lockInterruptibly() 方法允许我们在线程等待锁时中断它。这是一个有趣的特性,但是很难找到一个真正实际应用场景。如果你编写的代码需要非常快速响应中断,你需要使用 lockInterruptibly() API 来获得这种能力。但是,你通常在 lock()方法内部花费多长时间呢?

这种情况可能只在极端情况下才会有影响,大多数人在编写高级多线程代码时可能不会遇到这种情况。

ReadWriteReentrantLock

更好的方法是使用 ReadWriteReentrantLock。大多数资源都遵循频繁读取、少量写入的原则。由于读取变量是线程安全的,除非正在写入变量,否则没有必要加锁。这意味着我们可以将读取操作进行极致优化,同时稍微降低写操作的速度。

假设这是你的使用情况,你可以创建更快的代码。使用读写锁时,我们有两个锁,一个读锁,如下图所示。它允许多个线程通过,实际上是“自由竞争”的。


一旦我们需要写入变量,我们需要获得写锁,如下图所示。我们尝试请求写锁,但仍有线程从变量中读取,因此我们必须等待。


 一旦所有线程完成读取,所有读取操作都会阻塞,写入操作只能由一个线程执行,如下图所示。一旦释放写锁,我们将回到第一张图中的“自由竞争”状态。


这是一种强大的模式,我们可以利用它使集合变得更快。一个典型的同步列表非常慢。它同步所有的操作,包括读和写。我们有一个 CopyOnWriteArrayList,它对于读取操作非常快,但是任何写入操作都很慢。

如果可以避免从方法中返回迭代器,你可以封装列表操作并使用这个 API。例如,在以下代码中,我们将名字列表暴露为只读,但是当需要添加名字时,我们使用写锁。这可以轻松超过 synchronized 列表的性能:

private final ReadWriteLock LOCK = new ReentrantReadWriteLock();
private Collection<String> listOfNames = new ArrayList<>();
public void addName(String name) {
   LOCK.writeLock().lock();
   try {
       listOfNames.add(name);
   } finally {
       LOCK.writeLock().unlock();
   }
}
public boolean isInList(String name) {
   LOCK.readLock().lock();
   try {
       return listOfNames.contains(name);
   } finally {
       LOCK.readLock().unlock();
   }
}
复制代码

StampedLock

我们首先要理解 StampedLock 的是它不可重入。例如,我们有以下代码块:

synchronized void methodA() {
     // …
     methodB();
    // …
}
synchronized void methodB() {
     // …
}
复制代码

这个方案可行,因为 synchronized 是可重入的。我们已经持有锁,所以从 methodA()进入 methodB()不会阻塞。这在使用 ReentrantLock 时也同样适用,只要我们使用相同的锁或相同的 synchronized 对象。

 StampedLock 返回一个戳记(stamp),我们用它来释放锁。因此,它有一些限制,但它仍然非常快和强大。它也包括一个读写戳记,我们可以用它来保护共享资源。但 ReadWriteReentrantLock 不同的是,它允许我们升级锁。为什么需要这样做呢?

看一下之前的 addName()方法...如果我用"Shai"两次调用它会怎样?

是的,我可以使用 Set...但是为了这个练习的目的,让我们假设我们需要一个列表...我可以使用 ReadWriteReentrantLock 编写那个逻辑:

public void addName(String name) {
   LOCK.writeLock().lock();
   try {
       if(!listOfNames.contains(name)) {
           listOfNames.add(name);
       }
   } finally {
       LOCK.writeLock().unlock();
   }
}
复制代码

 这很糟糕。我“付出”写锁只是为了在某些情况下检查 contains()(假设有很多重复项)。我们可以在获取写锁之前调用 isInList(name)。然后我们会:

  • 获取读锁

  • 释放读锁

  • 获取写锁

  • 释放写锁

在两种情况下,我们可能会排队, 这样可能会增加额外的麻烦,不一定值得。

有了 StampedLock,我们可以将读锁更新为写锁,并在需要的情况下立即进行更改,例如:

public void addName(String name) {
   long stamp = LOCK.readLock();
   try {
       if(!listOfNames.contains(name)) {
           long writeLock = LOCK.tryConvertToWriteLock(stamp);
           if(writeLock == 0) {
               throw new IllegalStateException();
           }
           listOfNames.add(name);
       }
   } finally {
       LOCK.unlock(stamp);
   }
}
复制代码

这是针对这些情况的一个强大的优化。

终论

我经常不假思索地使用 synchronized 集合,这有时可能是合理的,但对于大多数情况来说,这可能是次优的。通过花费一点时间研究与线程相关的原语,我们可以显著提高性能。特别是在处理 Loom 时,其中底层争用更为敏感。想象一下在 100 万并发线程上扩展读取操作的情况...在这些情况下,减少锁争用的重要性要大得多。

你可能会想,为什么 synchronized 集合不能使用 ReadWriteReentrantLock 或者是 StampedLock 呢?

这是一个问题,因为 API 的可见接口范围非常大,很难针对通用用例进行优化。这就是控制低级原语的地方,可以使高吞吐量和阻塞代码之间的差异。


【注】本文译自: Relearning Java Thread Primitives - DZone

发布于: 刚刚阅读数: 4
用户头像

码语者

关注

分享程序人生。 2019-07-04 加入

“码”界老兵,分享程序人生。

评论

发布
暂无评论
重新学习Java线程原语_Java_码语者_InfoQ写作社区