写点什么

故障转移和恢复

作者:源字节1号
  • 2022 年 9 月 26 日
    浙江
  • 本文字数:880 字

    阅读完需:约 3 分钟

故障转移和恢复

故障转移(failover),即当活动的服务或应用意外终止时,快速启用冗余或备用的服务器、系统、硬件或者网络接替它们工作。 故障转移(failover)与交换转移操作基本相同,只是故障转移通常是自动完成的,没有警告提醒手动完成,而交换转移需要手动进行。

要使故障转移正常工作,必须有一个数据备份裸机服务器或虚拟机充当恢复站点系统,以便在发生故障时替换主站点。由于故障转移是灾难恢复中必不可少的步骤,因此数据备份系统本身必须不受故障影响。

需要持续可用性的系统需要整体故障转移和灾难恢复。在服务器级别,数据备份环境跟踪主服务器的“脉冲”,并在检测到中断时执行自动故障转移。

如何进行故障转移

有两种方法可以设置故障转移系统:主动-主动主动-被动(或主动-备用)配置。两种设置都需要至少两个节点(服务器或虚拟机)才能正常工作。

主动-主动设置中,多个节点同时运行。这允许他们分担工作量并防止任何一个节点过载。如果一个节点停止工作,它的工作负载将被其他活动节点占用,直到它重新激活。

主动-被动(主动-备用)设置还包括多个节点,但并非所有节点都同时处于活动状态。一旦主动节点停止工作,被动节点就会被激活并充当故障转移节点。当主节点再次运行时,数据备份节点将操作切换回主节点并再次变为被动状态。

无论采用哪种故障转移方法,两种配置都要求每个节点具有相同的配置。这确保了在站点之间切换时的一致性和稳定性。

什么是故障恢复

故障恢复是在计划内或计划外中断解决后切换回主站点的过程。故障恢复通常在故障转移之后作为灾难恢复计划的一部分。

故障恢复不是完成故障转移的唯一方法。使用虚拟机时,您可以执行永久故障回复,使数据备份虚拟机成为新的主站点。

如何进行故障恢复

成功执行故障回复需要一些准备。在切换回主站点之前,请考虑以下步骤:

1、检查与主站点的连接的质量和网络带宽。

2、检查备份站点上的所有数据是否存在潜在错误。这对于关键文件和文档尤其重要。

3、在开始故障恢复之前彻底测试所有主系统。

4、准备并实施故障恢复计划,以最大限度地减少停机时间和用户不便。


如若转载,请注明出处:开源字节   https://sourcebyte.cn/article/236.html

用户头像

源字节1号

关注

一个着迷于技术又喜欢不断折腾的技术活跃者 2022.03.09 加入

一个着迷于技术又喜欢不断折腾的技术活跃者。喜欢并热爱编程,执着于努力之后所带来的美好生活!

评论

发布
暂无评论
故障转移和恢复_软件开发_源字节1号_InfoQ写作社区