网络攻防学习笔记 Day144
系统可用性(availability),一般通过平均无故障时间来评估,具体公式为:Availability=MTBF/(MTBF+MTTR)×100%。平均故障时间(MTBF),同样也是描述整个系统可靠性的指标,对一个系统来说,MTBF(Mean Time Between Failure)是指整个系统的各组件(链路、节点)不间断地无故障连续运行的平均时间。MTTR(Mean Time To Repair),系统平均恢复时间,是描述整个系统容错能力的指标,指当系统运行出现问题时恢复到正常状态的平均时间。从公式上看,不管是出现故障问题的时长和频率,还是业务系统正常运行的时长都会影响可用性,在进行高可用性规划时通常选择在这两个方面同时入手。
保证整个系统的高可用性就是保障整个组织的业务连续性(Business Continuity,BC),这也要求要在为业务系统运行提供一个稳定的环境支撑其可靠性。它代表组织通过建立组织策略和响应能力,使业务能够稳定运行的能力,我们既可以从数据整个生命周期的各个阶段思考如何保证系统的运行,也可以在组成数据中心的各个组件上考虑如何使业务系统运行得更稳定。
链路聚合控制协议(Link Aggregation Control Protocol,LACP)是指将多个物理端口汇聚在一起,形成一个逻辑端口,以实现出/入流量吞吐量在各成员端口的负荷分担,交换机根据用户配置的端口负荷分担策略决定网络封包从哪个成员端口发送到对端的交换机。
双向转发检测协议 BFD(Bidirectional Forwarding Detection)是一套全网统一的检测机制,用于快速检测、监控网络中链路或者 IP 路由的转发连通状况,可以提供毫秒级的检测,也可以实现链路的快速检测。BFD 通过与上层路由协议联动,可以实现路由的快速收敛,确保业务的永续性。
备份方式的对比
通常使用两个指标来衡量组织的容灾性能,分别是恢复时间目标(Recovery Time Objective,RTO)和恢复点目标(Recovery Point Objective,RPO)。
RPO 是指在业务恢复后的数据与最新数据之间的差异程度,这个程度使用时间作为衡量指标。这种差异主要跟数据备份频率有关,备份的频率越高,代表备份的时间离当下时刻越近,也就是与当下时刻变化的数据越少,业务出现故障时,丢失的数据也就越少。如果 RPO 为零,那么就是数据进行实时备份。
RTO 是指从系统发生故障到恢复正常业务所需要的时间,也就是容许服务中断的时间,RTO 值越小,系统从故障中恢复的时间就越短,说明系统从灾难中恢复的能力越强,如果 RTO 为零,则说明服务永不中断。
灾难恢复能力级别
业务连续性管理(Business Continuity Management,BCM)是找出组织内有潜在影响的威胁及其对组织业务运行的影响,通过有效的响应措施保护组织的利益、信誉、品牌和创造价值的活动,并为组织建设提供恢复能力的整体框架的管理过程。
业务连续性计划(Business Continuity Plan,BCP)是基于业务运行规律的管理要求和规章流程,使一个组织能够在突发事件前迅速作出反应,以确保关键业务功能可以持续,不造成业务中断或业务流程本质的改变。
版权声明: 本文为 InfoQ 作者【穿过生命散发芬芳】的原创文章。
原文链接:【http://xie.infoq.cn/article/c7176e23af87e842b8853b259】。文章转载请联系作者。
评论