写点什么

CAP 原理, Doris 临时失效的处理过程

用户头像
garlic
关注
发布于: 2020 年 11 月 01 日
CAP原理, Doris 临时失效的处理过程



CAP原理



C是指一致性,请求要么成功要么失败,获取的都是最最新的数据, A是指可用性, 请求总会获得响应而不是返回一个错误或者无响应。 P是指分区耐受性,由于网络的原因, 服务节点会出现故障,消息存在丢失的情况但是仍然可以提供服务。



Dori 临时失效的处理过程



故障分类:



瞬时故障:

主要原因, 网路瞬间中断,服务器内存垃圾回收, 后台系统线程繁忙停止数据访问操作响应.

特点: 故障时间短, 秒级毫秒级自动回复.



临时故障:

主要原因:物理硬件故障,如网路设备故障,服务器硬件故障, 以及系统升级,停机维护导致的服务停止,

特点: 一般需要人工干预才能恢复. 故障时间在十几分钟甚至几个小时. 故障时间分为: :临时故障期间,临时故障恢复期间。

永久故障:

主要原因: 硬件故障到的数据丢失.

特点: 恢复时间需要更长, 永久故障期间,永久故障恢 复期间



临时故障失效恢复过程





2020-11-19 根据助教老师指正,参考老师参考答案更新了流程图





流程图主要调整的地方:

  1. 故障节点恢复成功通知管理中心改为临时服务节点恢复时通知管理中心,首问负责制,由于是管理节点通知临时节点向故障节点恢复数据, 后续如果故障节点恢复向临时发送反馈比较合适, 统一由临时节点进行反馈管理中心。 

  2. 故障节点恢复后管理中心会通知客户端, 恢复到故障节点的写访问请求,不再访问临时节点。这一切换是必须的否则, 客户端一直连接临时节点, 数据不断更新,无法进行故障恢复。



恢复流程

  • 故障节点恢复

  • 管理端通知客户端连接从临时节点恢复到故障恢复节点, 仍然是只写不读;

  • 管理端通知临时服务节点将数据恢复到故障恢复节点;

  • 故障恢复节点处理数据冲突

  • 临时节点同步完数据后通知管理端

  • 管理端通知客户端集群回复正常



参考及引用



架构师训练营作业-李智慧老师相关讲义

Photo by Hristo Georgiev from Pexels



用户头像

garlic

关注

还未添加个人签名 2017.11.15 加入

还未添加个人简介

评论

发布
暂无评论
CAP原理, Doris 临时失效的处理过程