写点什么

SD-WAN 网络可靠性设计

作者:阿泽🧸
  • 2022 年 9 月 06 日
    北京
  • 本文字数:2007 字

    阅读完需:约 7 分钟

SD-WAN网络可靠性设计

随着信息技术的快速发展和普及,企业对信息的依赖程度越来越高。网络作为信息传输的载体,企业对其可靠性的要求也越来越高,而建立一个可靠的网络系统是一项复杂且艰巨的工作。网络可靠性设计是网络规划设计的关键一环且非常复杂,SD-WAN 解决方案的可靠性设计,其中包括 3 个部分:网络链路可靠性设计、网络设备可靠性设计和网络核心站点可靠性设计。

1、网络链路可靠性设计

网络链路作为最基本的信息数据载体,是网络的命脉。网络链路的中断意味着信息传递的中断,这对很多领域(如金融、证券、航空、铁路、邮政等)的用户来说是灾难性的。这些领域的网络一旦发生故障,会带来非常巨大的经济损失。


从物理层面看,网络是由多种网络设备和线缆构建的,本身存在发生故障的可能性,如网络传输设备发生故障、物理线缆被暴力施工挖断、网络核心节点因天灾人祸失效等,这些都可能导致网络端到端连接的中断。为了规避这些风险,通常采用主备网络链路的策略,即同时建设一条主链路和一条备链路。这样的设计简单、可靠,美中不足的是备链路通常情况下处于备份的状态,不转发网络流量,这将导致企业客户为了可靠性不得不为之支付额外的专线费用。


SD-WAN 解决方案提供的链路主备方式撇弃了以上介绍的这种单纯的主备模式,网络站点的多条上行链路会同时处于活动状态,基于预设的流量调度策略使业务流量在多条链路中进行负载分担。当某条链路发生故障时,可以在极短的时间内检测出链路质量发生劣化,从而及时调整业务的流量策略,将流量从故障链路切换到正常链路上,提升链路的可靠性。如此可充分利用企业的接入专线,提高企业接入带宽,加强企业站点的互联。

  1. CPE 与 Underlay 网络全互联的场景

企业站点之间可基于多种 Underlay 网络(如 MPLS 网络和因特网)互联。站点 CPE 各有两条链路分别接入 MPLS 网络和因特网,并各自维护 Underlay 网络的连接信息,当其中某个 Underlay 网络发生故障后(如 MPLS 网络发生故障),站点 CPE 主动将业务流量切换至另一个 Underlay 网络的链路,确保分支站点之间能够正常通信。

  1. CPE 分别连接一个 Underlay 网络的场景

当某个站点采用双 CPE 作为出口网关,CPE 之间通过互联链路连接,同时 CPE 上行仅连接一个 Underlay 网络(如 MPLS 网络或因特网)。各 CPE 仅负责检测自身上行互联的 Underlay 网络的状态,并通知另一台 CPE 监测结果。当某台 CPE 检测到互联的 Underlay 网络链路发生故障后,会通知另一台 CPE,同时对报文转发策略进行调整,将报文通过互联链路转发到另一台 CPE,从而规避上行链路的故障问题。

2、网络设备可靠性设计

除了线路故障外,网络设备故障也是网络可靠性的重灾区,特别是作为站点出口的网关设备,一旦发生故障,将直接影响站点间的互通。出于保障站点可靠性的考虑,站点出口处通常会部署两台 CPE。与传统备份方式不同的是,这两台 CPE 不是工作在主备模式下,而是工作在双活模式下,即两台设备同时工作,当其中一台 CPE 发生故障后,另一台 CPE 将承担所有流量的转发。


由于两台设备同时工作,需要同步其业务信息(如业务会话、应用识别的信息)、链路统计信息和报文调度的策略,使两台设备可以像一台设备那样工作。除了各种信息的同步外,两台设备间可通过探测协议识别彼此的状态。一旦发现邻居设备出现故障,当前正常的设备将接管所有站点的业务,保证网络通信的连通性,并实时调整报文调度的机制,使业务体验达到最佳。


站点内设备的备份有以下两种方式。

  • LAN 侧二层组网:可通过 VRRP 进行备份。VRRP 可以支持多个 VRRP 实例,通过多个实例实现设备的负载分担。

  • LAN 侧三层组网:可通过等价路由进行备份。传统路由器从 SD-WAN 设备中学习到等价路由,在正常情况下通过 ECMP(Equal-Cost Multi-Path,等价多路径)进行负载分担,当设备出现故障时,对应的邻居关系被撤除,相应的路由信息被撤销。

3、网络核心站点可靠性设计

自然灾害等不可抗拒的因素(如地震、火灾等)会导致企业核心站点(如 Hub 站点)出现故障。核心站点失效后,其他站点将处于信息孤岛中,与外界完全失去网络联系,严重影响企业网络的正常运转。因此,核心站点的可靠性显得尤其重要。

  1. Hub 站点冗余设计

采用 Hub-spoke 组网模式时,所有分支站点的数据都需经过 Hub 站点,若 Hub 站点失效,则可能导致整网的瘫痪。因此,不仅 Hub 站点内的设备需采用可靠性方案,同时站点本身也需要采用冗余方案。SD-WAN 解决方案提供了双 Hub 站点冗余方案,当主 Hub 站点发生故障后,所有流量将能很快地切换至备份 Hub 站点,该过程无须人工干预。


  1. 重定向站点冗余设计

在 Full-mesh 组网中,站点间是通过建立直连隧道进行通信的;若站点间 Underlay 网络无法互通,则站点间无法建立直连隧道。为了解决此问题,SD-WAN 解决方案引入了重定向站点。为了提升重定向站点的可靠性,需要针对重定向站点进行冗余设计,即当其中一个重定向站点出现故障时,流量能很快地切换至备用重定向站点。因重定向站点需要中转其他站点间的流量,对吞吐量有较高的要求,所以一般选择企业的总部、数据中心或大中型的分支站点来兼任此角色。


发布于: 2022 年 09 月 06 日阅读数: 56
用户头像

阿泽🧸

关注

还未添加个人签名 2020.11.12 加入

还未添加个人简介

评论

发布
暂无评论
SD-WAN网络可靠性设计_9月月更_阿泽🧸_InfoQ写作社区