第 06 周 CAP 原理
1998 年,加州大学的计算机科学家 Eric Brewer 提出,分布式系统有三个指标:
Consistency(一致性)
Availability(可用性)
Partition tolerance(分区容错性)
它们的第一个字母分别是 C、A、P。Eric Brewer 说,这三个指标不可能同时做到。这个结论就叫做 CAP 定理。
C:Consistency,即一致性,意思是,写操作之后的读操作,必须返回该值。访问所有的节点得到的数据应该是一样的。注意,这里的一致性指的是强一致性,也就是数据更新完,访问任何节点看到的数据完全一致,要和弱一致性,最终一致性区分开来。
A:Availability,即可用性,意思是只要收到用户的请求,服务器就必须给出回应。所有的节点都保持高可用性。注意,这里的高可用还包括不能出现延迟,比如如果节点 B 由于等待数据同步而阻塞请求,那么节点 B 就不满足高可用性。也就是说,任何没有发生故障的服务必须在有限的时间内返回合理的结果集。
P:Partiton tolerance,即分区容忍性,大多数分布式系统都分布在多个子网络。每个子网络就叫做一个区(partition)。分区容错的意思是,区间通信可能失败。比如,一台服务器放在中国,另一台服务器放在美国,这就是两个区,它们之间可能无法通信。系统设计的时候,必须考虑到这种情况。一般来说,分区容错无法避免,因此可以认为 CAP 的 P 总是成立。CAP 定理告诉我们,C 和 A 无法同时做到。
意思是只要收到用户的请求,服务器就必须给出回应。
一致性和可用性,为什么不可能同时成立?答案很简单,因为可能通信失败(即出现分区容错)。
如果保证 G2 的一致性,那么 G1 必须在写操作时,锁定 G2 的读操作和写操作。只有数据同步后,才能重新开放读写。锁定期间,G2 不能读写,没有可用性不。
如果保证 G2 的可用性,那么势必不能锁定 G2,所以一致性不成立。
综上所述,G2 无法同时做到一致性和可用性。系统设计时只能选择一个目标。如果追求一致性,那么无法保证所有节点的可用性;如果追求所有节点的可用性,那就没法做到一致性。
参考资料:
http://www.ruanyifeng.com/blog/2018/07/cap.html
https://blog.csdn.net/u013332124/article/details/82874178
版权声明: 本文为 InfoQ 作者【Airship】的原创文章。
原文链接:【http://xie.infoq.cn/article/a60f2593109b5dfbff0e0dc8a】。未经作者许可,禁止转载。
评论