架构学习第六周作业

关注

发布于: 2020 年 07 月 15 日

﻿
请简述 CAP 原理。
针对 Doris 案例，请用 UML 时序图描述 Doris 临时失效的处理过程（包括判断系统进入临时失效状态，临时失效中的读写过程，失效恢复过程）。
﻿
CAP 理论
     CAP理论， C指的是一致性，A 是可用性，P是分区容忍性。CAP 关注的粒度是数据，而不是整个系统。在网络分区发生时，只能在一致性和可用性之间选一个。
﻿
    虽然 CAP 理论定义是三个要素中只能取两个，但放到分布式环境下来思考，我们会发现必须选择 P（分区容忍）要素，因为网络本身无法做到 100% 可靠，有可能出故障，所以分区是一个必然的现象。如果我们选择了 CA 而放弃了 P，那么当发生分区现象时，为了保证 C，系统需要禁止写入，当有写入请求时，系统返回 error（例如，当前系统不允许写入），这又和 A 冲突了，因为 A 要求返回 no error 和 no timeout。因此，分布式系统理论上不可能选择 CA 架构，只能选择 CP 或者 AP 架构。
   1.CP - Consistency/Partition Tolerance
     为了保证一致性，当发生分区现象后，N1 节点上的数据已经更新到 y，但由于 N1 和 N2 之间的复制通道中断，数据 y 无法同步到 N2，N2 节点上的数据还是 x。这时客户端 C 访问 N2 时，N2 需要返回 Error，提示客户端 C“系统现在发生了错误”，这种处理方式违背了可用性（Availability）的要求，因此 CAP 三者只能满足 CP。
   2.AP - Availability/Partition Tolerance
     当发生分区现象后，N1 节点上的数据已经更新到 y，但由于 N1 和 N2 之间的复制通道中断，数据 y 无法同步到 N2，N2 节点上的数据还是 x。这时客户端 C 访问 N2 时，N2 将当前自己拥有的数据 x 返回给客户端 C 了，而实际上当前最新的数据已经是 y 了，这就不满足一致性（Consistency）的要求了，因此 CAP 三者只能满足 AP。注意：这里 N2 节点返回 x，虽然不是一个“正确”的结果，但是一个“合理”的结果，因为 x 是旧的数据，并不是一个错乱的值，只是不是最新的数据而已。
﻿
一个分布式存储系统，不同类型数据，可能采用不同方案。例如表结构元数据采用CP, 而表数据采用AP
﻿

发布于: 2020 年 07 月 15 日阅读数: 55

原文链接:【http://xie.infoq.cn/article/a2ad0989fa0b563f5e51a86f1】。未经作者许可，禁止转载。

乐天

关注

还未添加个人签名 2020.02.02 加入

还未添加个人简介

评论 (1 条评论)

发布

创作场景

架构学习第六周作业

乐天

评论 (1 条评论)