CAS
介绍
CAS 可以保证对共享变量操作的原子性
CAS 全称 Compare And Swap,比较与交换,是乐观锁的主要实现方式。CAS 在不使用锁的情况下实现多线程之间的变量同步。ReentrantLock 内部的 AQS 和原子类内部都使用了 CAS。
CAS 算法涉及到三个操作数:需要读写的内存值 V。进行比较的值 A。要写入的新值 B。只有当 V 的值等于 A 时,才会使用原子方式用新值 B 来更新 V 的值,否则会继续重试直到成功更新值。
以 AtomicInteger 为例,AtomicInteger 的 getAndIncrement()方法底层就是 CAS 实现,关键代码是 compareAndSwapInt(obj, offset, expect, update),其含义就是,如果 obj 内的 value 和 expect 相等,就证明没有其他线程改变过这个变量,那么就更新它为 update,如果不相等,那就会继续重试直到成功更新值。
CAS 存在的问题
CAS 不加锁,保证一次性,但是需要多次比较
循环时间长,开销大
例如 AtomicInteger 因为执行的是 do while,如果比较不成功一直在循环,最差的情况,就是某个线程一直取到的值和预期值都不一样,这样就会无限循环)
解决方案:可以使用 java8 中的 LongAdder,分段 CAS 和自动分段迁移。
只能保证一个共享变量的原子操作
当对一个共享变量执行操作时,我们可以通过循环 CAS 的方式来保证原子操作
但是对于多个共享变量操作时,循环 CAS 就无法保证操作的原子性,这个时候只能用锁来保证原子性
解决方案:可以用 AtomicReference,这个是封装自定义对象的,多个变量可以放一个自定义对象里,然后他会检查这个对象的引用是不是同一个。如果多个线程同时对一个对象变量的引用进行赋值,用 AtomicReference 的 CAS 操作可以解决并发冲突问题。
ABA 问题
假设两个线程 T1 和 T2 访问同一个变量 V,当 T1 访问变量 V 时,读取到 V 的值为 A;此时线程 T1 被抢占了,T2 开始执行,T2 先将变量 V 的值从 A 变成 B,然后又将变量 V 的值从 B 变成 A;此时 T1 又抢占了主动权,继续执行,它发现 V 的值还是 A,以为没有变化,所以就继续执行了。这个过程中,变量 V 从 A 变为 B,再由 B 变为 A 就形象的称为 ABA 问题。
解决方案:可以引入版本号改变这个问题,每次改变版本号都+1
从 Java 1.5 开始,JDK 的 Atomic 包里提供了一个类 AtomicStampedReference 来解决 ABA 问题。这个类的 compareAndSet 方法的作用是首先检查当前引用是否等于预期引用,并且检查当前标志是否等于预期标志,如果全部相等,则以原子方式将该引用和该标志的值设置为给定的更新值。
无锁并发
CAS 可以保证对共享变量操作的原子性,而 volatile 可以实现可见性和有序性,结合 CAS 和 volatile 可以实现无锁并发,适用于竞争不激烈,多核 CPU 的场景下。
CAS 之所以效率高是因为在其内部没有使用 synchronized 关键字,CAS 不会让线程进入阻塞状态,那么也就避免了 synchronized 当中用户态和内核态的切换所带来的的性能消耗问题,也避免了线程挂起等问题。如果竞争非常激烈,那么 CAS 就会出现线程大量重试,因为多线程来进行竞争,那么也就导致有可能很多的线程设置取值失败,那么又要进行 while 循环重试,即大量的线程进行重试操作,成功存的线程反而不多,那么这样的话反而会使性能大大降低。所以如果竞争太激烈还使用的是 CAS 机制,会导致其性能比 synchronized 还要低。
小结
CAS 可以将比较和交换转换为原子操作,这个原子操作直接由处理器保证(由 CPU 支持),会拿旧的预估值与内存当中的最新值进行比较;如果相同就进行交换并且把最新的值赋值到内存当中的这个变量;
CAS 必须借助 volatile 才能读取到共享变量的最新值来实现【比较并交换】的效果。
使用 CAS 时,线程数不要超过 CPU 的核心数,每个 CPU 核心都能同时并行某个线程,超过的话想运行也运行不了,得发生上下文切换。线程的上下文切换的成本很高,要保存线程的信息,当从阻塞恢复成可运行,还要恢复线程的信息。
原子类 Atomic
AtomicInteger
问题
public class Demo01 {
// 定义一个共享变量 num
private static int num = 0;
public static void main(String[] args) throws InterruptedException {
// 任务:对 num 进行10000次加操作
Runnable mr = () -> {
for (int i = 0; i < 10000; i++) {
num++; // num++并不是原子操作,就会导致原子性问题的产生
}
};
ArrayList<Thread> ts = new ArrayList<>();
// 同时开辟5个线程执行任务
for (int i = 0; i < 5; i++) {
Thread t = new Thread(mr);
t.start();
ts.add(t);
}
for (Thread t : ts) {
t.join();
}
//因此最终会输出的num < 50000
System.out.println("num = " + num);
}
}
复制代码
改为原子类
public class Demo01 {
public static void main(String[] args) throws InterruptedException {
//
AtomicInteger atomicInteger = new AtomicInteger();
// 任务:自增 10000 次
Runnable mr = () -> {
for (int i = 0; i < 10000; i++) {
atomicInteger.incrementAndGet(); //该自增操作是一个原子性的操作
}
};
ArrayList<Thread> ts = new ArrayList<>();
for (int i = 0; i < 5; i++) {
Thread t = new Thread(mr);
t.start();
ts.add(t);
}
for (Thread t : ts) {
t.join();
}
//由于是原子操作,值将一直会是50000
System.out.println("number = " + atomicInteger.get());
}
}
复制代码
底层源码
AtomicInteger 类当中其内部会包含一个叫做 UnSafe 的类,该类可以保证变量在赋值时的原子操作;
/* AtomicInteger.java */
private volatile int value; // value初始取值为0
public final int incrementAndGet() {
// this:自己 new 好的 atomicInteger对象
// valueOffset:内存偏移量
// 1 :这个方法时自增操作,因此是1
return unsafe.getAndAddInt(this, valueOffset, 1) + 1;
}
复制代码
/* Unsafe.class */
// var1:上面的this,即atomicInteger对象; var2:valueOffset ; var4:要添加的值
public final int getAndAddInt(Object var1, long var2, int var4) {
// var5 旧的预估值
int var5;
do {
// this 和 内存 valueOffset,目的是找出这个 value的当前最新值(旧的预估值)
var5 = this.getIntVolatile(var1, var2);
} while (!this.compareAndSwapInt(var1, var2, var5, var5 + var4));
return var5;
}
复制代码
变量解释:
compareAndSwapInt(var1, var2, var5, var5 + var4) 表示用该对象当前的值与 var5 比较
需要比较工作内存中的值,和主内存中的值进行比较
假设执行 compareAndSwapInt 返回 false,那么就一直执行 while 方法,直到期望的值和真实值一样
假设线程 A 和线程 B 同时执行 getAndInt 操作(分别跑在不同的 CPU 上)
AtomicInteger 里面的 value 原始值为 3,即主内存中 AtomicInteger 的 value 为 3,根据 JMM 模型,线程 A 和线程 B 各自持有一份价值为 3 的副本,分别存储在各自的工作内存
线程 A 通过 getIntVolatile(var1 , var2) 拿到 value 值 3,这时线程 A 被挂起(该线程失去 CPU 执行权)
线程 B 也通过 getIntVolatile(var1, var2)方法获取到 value 值也是 3,此时刚好线程 B 没有被挂起,并执行了 compareAndSwapInt 方法,比较内存的值也是 3,成功修改内存值为 4,线程 B 打完收工,一切 OK
这时线程 A 恢复,执行 CAS 方法,比较发现自己手里的数字 3 和主内存中的数字 4 不一致,说明该值已经被其它线程抢先一步修改过了,那么 A 线程本次修改失败,只能够重新读取后在来一遍了,也就是继续执行 do while
线程 A 重新获取 value 值,因为变量 value 被 volatile 修饰,所以其它线程对它的修改,线程 A 总能够看到,线程 A 继续执行 compareAndSwapInt 进行比较替换,直到成功。
但是 AtomicInteger 会存在 CAS 循环开销大的问题,因此 JDK8 引入 LongAdder 来解决这个问题
LongAdder
LongAdder 主要使用分段 CAS 以及自动分段迁移的方式来大幅度提升多线程高并发执行 CAS 操作的性能
实现过程:
在 LongAdder 的底层实现中,首先有一个 base 值,刚开始多线程来不停的累加数值,都是对 base 进行累加的,比如刚开始累加成了 base = 5。
接着如果发现并发更新的线程数量过多,就会开始施行分段 CAS 的机制,也就是内部会搞一个 Cell 数组,每个数组是一个数值分段。
这时,让大量的线程分别去对不同 Cell 内部的 value 值进行 CAS 累加操作,这样就把 CAS 计算压力分散到了不同的 Cell 分段数值中了!
这样就可以大幅度的降低多线程并发更新同一个数值时出现的无限循环的问题,大幅度提升了多线程并发更新数值的性能和效率!
内部实现了自动分段迁移的机制,也就是如果某个 Cell 的 value 执行 CAS 失败了,那么就会自动去找另外一个 Cell 分段内的 value 值进行 CAS 操作。这样也解决了线程空旋转、自旋不停等待执行 CAS 操作的问题,让一个线程过来执行 CAS 时可以尽快的完成这个操作。
最后,如果要从 LongAdder 中获取当前累加的总值,就会把 base 值和所有 Cell 分段数值加起来返回。
总的来说 LongAdder 减少了乐观锁的重试次数
add 源码
public void add(long x) {
//as 表示cells引用
//b 表示获取的base值
// v 表示期望值
// m表示cells的数组长度 - 1 (cells长度一定是2的幂)
// a表示当前现成命中的cell单元格
Cell[] as; long b, v; int m; Cell a;
//条件一: true->表示cells已经初始化过了,当前线程应该将数据写入到对应的cell中
// false->表示cells未初始化,当前所有线程应该将数据写入到base中
//条件二: 要执行到条件二,说明条件一是false
// true-> 表示发生竞争了,可能需要重试或者扩容
// false-> 表示当前现成CAS替换数据成功,
if ((as = cells) != null || !casBase(b = base, b + x)) {
//什么时候进入?
//1.条件一 true->表示cells已经初始化过了,当前线程应该将数据写入到对应的cell中
//2.条件二 true-> 表示发生竞争了,可能需要重试或者扩容
// true 表示未发生竞争,false 发生竞争
boolean uncontended = true;
//条件一: true -> cells未初始化,说明此时是通过 2,多线程写base发生竞争进来的
// false -> cells初始化了,说明是 那么当前线程应该找自己的cell写值
if (as == null || (m = as.length - 1) < 0 ||
//条件一为false,就走条件二
//条件二:getProbe():获取当前线程的hash值 getProbe()&m 会 <= m 。因此as[getProbe() & m])就表示当前线程想把数据扔进去的单元格
// true->说明当前线程对应下标的cell为空,需要longAccumulate 创建
// false->说明当前线程对应下标的cell不为空,下一步想要将x值添加到cell中
(a = as[getProbe() & m]) == null ||
//如果条件二位false,就走条件三
//条件三:将x值添加到cell的过程
// true->表示cas添加失败,意味着当前线程对应的cell有竞争
// false->表示cas成功,
!(uncontended = a.cas(v = a.value, v + x)))
//什么时候会调用这个方法?
//1. 条件一: true -> cells未初始化,说明此时是通过 2,多线程写base发生竞争进来的。说明后续需要 重试 或者 初始化cells
//2. 条件二:true->说明当前线程对应下标的cell为空,需要longAccumulate 创建
//3. 条件三:true->表示cas添加失败,意味着当前线程对应的cell有竞争。后续需要 重试 或者 扩容
longAccumulate(x, null, uncontended);
}
}
复制代码
longAccumulate 方法
//什么时候会调用这个方法?
//1. 条件一: true -> cells未初始化,说明此时是通过 2,多线程写base发生竞争进来的。说明后续需要 重试 或者 初始化cells
//2. 条件二:true->说明当前线程对应下标的cell为空,需要longAccumulate 创建
//3. 条件三:true->表示cas添加失败,意味着当前线程对应的cell有竞争。后续需要 重试 或者 扩容
//wasUncontended:只有cells初始化之后,并且当前线程竞争修改失败,才会是false
final void longAccumulate(long x, LongBinaryOperator fn,
boolean wasUncontended) {
//当前线程的hash值
int h;
//条件 true->表示当前线程还未分配hash值
if ((h = getProbe()) == 0) {
//因此,执行分配hash值的逻辑
ThreadLocalRandom.current(); // force initialization
h = getProbe();
//为什么?因为在这之前当前线程没有hash值,也就是0,那么当前线程肯定是写入到cells[0]的位置
//如果没有分配hash值的都写到cells[0],那就出现了cells[0]的竞争。那么就不应该把这次竞争当成真正的竞争,因此修改为true
wasUncontended = true;
}
//表示 扩容意向,false:一定不会扩容;true:可能会扩容
boolean collide = false; // True if last slot nonempty
//自旋
for (;;) {
// as 表示cells引用
// a 表示当前线程命中的cell
// n 表示cells数组长度
// v 表示期望值
Cell[] as; Cell a; int n; long v;
//case1:条件1:true -> cells已经初始化,当前线程应该写入数据到对应cell中
// 条件2:true -> 数组长度大于0,与上面一样
if ((as = cells) != null && (n = as.length) > 0) {
//什么时候来到case1
//2. 条件二:true->说明当前线程对应下标的cell为空,需要longAccumulate 创建
//3. 条件三:true->表示cas添加失败,意味着当前线程对应的cell有竞争。后续需要 重试 或者 扩容
//case 1.1:true -> 当前线程对应下标的cell为空,需要创建cell
if ((a = as[(n - 1) & h]) == null) {
//true->当前是无锁未被占用,false->锁被占用
if (cellsBusy == 0) { // Try to attach new Cell
//创建cell
Cell r = new Cell(x); // Optimistically create
//条件一:cellsBusy == 0
// true->当前无锁,当前线程可以竞争这把锁
//条件二:casCellsBusy(),竞争锁
// true->当前线程获取锁
if (cellsBusy == 0 && casCellsBusy()) {
//定义是否创建成功的标记
boolean created = false;
try { // Recheck under lock
//rs表示当前cells引用
//m cells长度
//j 当前线程命中下标
Cell[] rs; int m, j;
//条件一条件二恒成立
//条件三:rs[j = (m - 1) & h] == null? 在case1.1时已经判断过这个位置了,为什么这里还要判断?
//原因是多线程并发情况下,有线程可能已经在执行下述流程,此时在case1.1判断为null,但到这里已经有线程执行过了,因此需要重新判断
if ((rs = cells) != null &&
(m = rs.length) > 0 &&
rs[j = (m - 1) & h] == null) {
rs[j] = r;
created = true;
}
} finally {
//释放锁
cellsBusy = 0;
}
if (created)
break;
continue; // Slot is now non-empty
}
}
//扩容意向改为false
collide = false;
}
//case 1.2: wasUncontended:只有cells初始化之后,并且当前线程竞争修改失败,才会是false
else if (!wasUncontended) // CAS already known to fail
wasUncontended = true; // Continue after rehash
//case1.3:什么时候到这,当前线程重置过hash值。新命中的cell不为空
// true->将数据写入cell成功,那就可以退出了
// false->表示重置hash后命中的新的cell也有竞争,重试1次,会执行case1.4
else if (a.cas(v = a.value, ((fn == null) ? v + x :
fn.applyAsLong(v, x))))
break;
//case1.4:n>=NCPU
// true->数组长度大于等于CPU数量
// false->数组长度还可以扩容
// cells != as?
// true->其它线程已经扩容过了,当前线程就应该重置hash重试
else if (n >= NCPU || cells != as)
//扩容意向改为false
collide = false; // At max size or stale
//case1.5:!collide
// true->表示设置扩容意向为true,但不一定扩容,因为需要自旋重新尝试
else if (!collide)
collide = true;
//case 1.6:真正扩容的逻辑
// 条件一:cellsBusy == 0
// true->当前无锁,当前线程可以竞争这把锁
//条件二:casCellsBusy(),竞争锁
// true->当前线程获取锁,当前线程执行可以扩容逻辑
//false就说明有其他线程在执行扩容
else if (cellsBusy == 0 && casCellsBusy()) {
try {
//这里与之前的逻辑一致,需要再次判断
if (cells == as) { // Expand table unless stale
Cell[] rs = new Cell[n << 1];//扩容长度翻倍,长度是2的幂
for (int i = 0; i < n; ++i)
rs[i] = as[i];
cells = rs;
}
} finally {
cellsBusy = 0;
}
collide = false;
continue; // Retry with expanded table
}
//重置当前线程hash值
h = advanceProbe(h);
}
//case2: 显然要到case2,case1就为false,也就是cells还未初始化,as为null
// 条件一:true -> 当前未加锁
// 条件二:cells == as? 原因在多线程并发情况下,有线程可能已经在执行下述流程,此时在case1判断为null,但到case2可能已经扩容完成了,cells可能就不为null了
// 条件三:true -> 表示获取锁成功,casCellsBusy() = 1。
// false -> 表示其它线程正在持有锁
else if (cellsBusy == 0 && cells == as && casCellsBusy() = 1。
) {
boolean init = false;
try { // Initialize table
//为了防止其它线程已经初始化了,当前线程再次初始化,丢失数据
if (cells == as) {
Cell[] rs = new Cell[2];
rs[h & 1] = new Cell(x);
cells = rs;
init = true;
}
} finally {
//释放锁
cellsBusy = 0;
}
if (init)
break;
}
//case3:什么时候会到这个条件。
//1. 当前casCellsBusy()锁已经被持有,说明其他线程正在初始化cells
//2. cells被其他线程初始化了
//那么此时就应该去累加数据了
else if (casBase(v = base, ((fn == null) ? v + x :
fn.applyAsLong(v, x))))
break; // Fall back on using base
}
}
复制代码
AtomicStampedReference
AtomicStampedReference 主要维护包含一个对象引用以及一个可以自动更新的整数"stamp"的 pair 对象来解决 ABA 问题。
public class AtomicStampedReference<V> {
private static class Pair<T> {
final T reference; //维护对象引用
final int stamp; //用于标志版本
private Pair(T reference, int stamp) {
this.reference = reference;
this.stamp = stamp;
}
static <T> Pair<T> of(T reference, int stamp) {
return new Pair<T>(reference, stamp);
}
}
private volatile Pair<V> pair;
....
/**
* expectedReference :更新之前的原始值
* newReference : 将要更新的新值
* expectedStamp : 期待更新的标志版本
* newStamp : 将要更新的标志版本
*/
public boolean compareAndSet(V expectedReference,
V newReference,
int expectedStamp,
int newStamp) {
// 获取当前的(元素值,版本号)对
Pair<V> current = pair;
return
// 引用没变
expectedReference == current.reference &&
// 版本号没变
expectedStamp == current.stamp &&
// 新引用等于旧引用
((newReference == current.reference &&
// 新版本号等于旧版本号
newStamp == current.stamp) ||
// 构造新的Pair对象并CAS更新
casPair(current, Pair.of(newReference, newStamp)));
}
private boolean casPair(Pair<V> cmp, Pair<V> val) {
// 调用Unsafe的compareAndSwapObject()方法CAS更新pair的引用为新引用
return UNSAFE.compareAndSwapObject(this, pairOffset, cmp, val);
}
复制代码
可以看到,java 中的实现跟我们上面讲的 ABA 的解决方法是一致的。
文章转载自:seven97_top
原文链接:https://www.cnblogs.com/seven97-top/p/18455310
体验地址:http://www.jnpfsoft.com/?from=infoq
评论