写点什么

管理区解耦架构见过吗?能帮客户搞定大难题的

  • 2022 年 7 月 28 日
  • 本文字数:2644 字

    阅读完需:约 9 分钟

管理区解耦架构见过吗?能帮客户搞定大难题的

本文分享自华为云社区《【华为云Stack】【大架光临】第13期:管理区解耦架构见过吗?帮政企客户搞定大难题》,作者:李俊武 华为云 Stack 资深架构师,申思  华为云 Stack 基础服务首席架构师。

管理区解耦介绍


类似公有云架构理念,主打政企客户本地部署的华为云 Stack 保持和华为公有云同架构,包括 Region、AZ、主机组等相关区域概念也基本一致。从云平台相关组件/云服务作用域划分来看,通常业界也会将组件/云服务部署位置分为 Global 作用域和 Region 作用域,Global 组件/服务就是属于云的管理区。


• Global 组件/服务:作用在各 Region 的,比如云管、认证鉴权的 IAM 服务、跨 Region 的管理面容灾或业务面的 CSDR、跨 Region 的网络互通 CC 服务(Cloud Connect)等,在实际使用中面向一朵云下的多个 Region

• Region 作用域:Region 级的服务则是通常作用在 Region 内部,比如 Region1 的 ECS 服务可以给 Region1 发放虚拟机,但它无法发放另一个 Region2 的虚拟机,类似的还有 EVS 块存储、VPC、EIP、VPN 服务等。


这里有两个服务比较特殊,可能和读者理解的不太一致,需要澄清一下。1)VPC-Peering 打通的是一个 Region 内两个 VPC 的网络互通,所以和 CC 不同,也定位为 Region 级云服务;2)ELB 云服务虽然可以添加该 Region 外的 IP 地址作为后端,但是 ELB 所能看到的也是该 Region 内部的对象和该 Region 可互通的对象,所以也是 Region 级的云服务;


华为云 Stack 的管理区解耦,提供了一个轻敏的底座来部署我们的 Global 组件和服务,这样形成一个特定部署区域,我们称之为独立 Global 区,并且可以部署两个独立 Global 区来实现 Global 组件/服务的管理面的容灾能力。


原来的部署架构是将 Global 组件/服务选择某个业务 Region 进行部署,作为首 Region;再选择一个作为备 Region,以此来实现 Global 组件/服务的容灾;其余业务称为从 Region。现在,通过华为云 Stack 的自动化部署实现了管理区解耦区部署,这样就可以扩容和变更相关的业务 Region,也能在管理多版 Region 时相互独立变更和操作。第一个 Global 区是首 Region;第二个 Global 区是备 Region,来实现 Global 组件/服务的容灾;其余业务 Region 都是从 Region。也就是说,和整体主备主从的架构理念是一致的。


图 1 开启容灾的管理区解耦设计


这就好比在一些地区供电,从前每家每户有自己的发电机,A 家庭进行了扩建,也要同时对发电机进行更新升级;A 家庭的发电机损坏了,B 家庭为 A 家庭继续供电会浪费时间和经历。但现在使用统一电网,即管理区解耦,同时还有一个备用电网,如果电网损坏,会有备用电网立刻补上,减少时间损耗;同时,每个家庭进行扩建都很方便。


管理区解耦的优势也很明显:


1. 整体更轻敏:对于部署/升级/后续变更操作都耗时比较少,演进方便;

2. 管理面高可用:如上所述,独立 global 区具有管理面容灾能力,具有好的高可用性;

3. 版本迭代更方便:独立 Global 区可以管理大量不同版本的 Region,通常遵循 N-2 原则;Region 可以各自独立扩容、升级和变更,无需其他业务 Region 配合,从而实现各个业务 Region 间的变更解耦。

4. 部署更灵活:独立 Global 区可以在独立的数据中心,无需和所管辖区域共 DC 部署

管理区解耦典型使用场景


管理区解耦部署这个架构,可以帮助政企客户解决一些常年累月积累的顽疾。

一、存量演进


软件的整体架构会随着支持的云服务种类的增多、计算节点的增加规模越来越大,这时,就需要对软件进行架构优化。架构优化会对产品带来巨大的收益,但是可能出现的代价之一,是会让原来架构的存量 Region 升级更复杂、甚至无法升级,这就要导致不同架构的 Region 需要在一朵云下进行统一管理。为了解决不同架构的 Region 并存的问题,基于管理区解耦,可以实现平滑演进和扩容新架构 Region。


图 2 存量演进场景


在存量演进场景下,除自动化部署工具外,还提供了 Global 组件/服务的自动化搬迁工具能力,除同类型 CPU 的搬迁能力外,还实现了跨 CPU 类型的数据搬迁能力。可以实现原存量合布 Region 是 X86 的管理节点,将 Global 组件/服务的数据,搬迁到 ARM CPU 管理节点的独立 Global 区上,反之从 ARM 到 X86 可以同样支持。

二、 多云合一


在政企客户中,基于公司合并、组织调整、人事变动等情况,客户会要求将存量的多朵 HCS 合并成一个 HCS,以便实现一朵云管理。相比原来提供的云联邦,基于管理区解耦提供了多云合一能力,能够更匹配客户一朵云的管理诉求,来实现客户的统一管理能力。


图 3 多云合一场景


首先创建一个新的独立的 Global 区,将需要合并的云的 Global 管理区,逐一合入到新建的 Global 区即可;这里的数据合并类似上述存量演进的 Global 组件/服务的数据搬迁,我们也提供了工具自动化能力;这样,通过工具自动化能力,可以将任意所需的多朵云逐步合并为一朵云。

三、集权管理


在政企客户通常会有组织总部和分支的划分,总部进行决策和整体操盘控制,不部署业务,分支使用云资源,进行该地域的业务经营。通常,总部为了控制采购、划分组织模型、统筹资源等原因,会构建全局一朵云,分支的认证鉴权要到总部去申请。在我们管理区解耦架构下,通过创建没有任何资源池和租户云服务能力的独立 Global 区,进行客户云管/IAM 的部署和控制,分支可独立负责并申请扩容 Region 资源池,总部来进行审计和审批。这样可以满足总部和分支对云平台各司其职的协作关系。


图 4 集权管理场景


除此之外,Global 还可以管理分部不同版本的 Region 资源池,从而来实现前面说的,不同分支间操作仅需要被总部感知,其他业务 Region 相互间变更不影响,有效降低了不同分部间流程审批的时间、提高效率。

四、 跨池搬迁


在 Region 内,为支持滚动升级,VM 提供了热迁移或跨 AZ 的迁移能力;而在一朵云下的多个 Region 资源池,由于客户数据中心租赁到期、客户存量资源池扩容空间不够等原因,很多客户都有将 Region 内的 VM 和存储数据搬迁到另一个 Region 上的诉求。我们在管理区解耦下的搬迁能力,可以先复用存量数据,将 Global 组件/服务数据搬迁到 Global 独立区上,然后再扩容新的业务 Region(可以是新架构的业务 Region),实现跨 Region 甚至不同架构的搬迁能力。


图 5 跨池搬迁场景


在管理区解耦下进行跨池搬迁,可以继承原来客户已有的账户/口令、组织模型和相关数据,最大程度减少搬迁前后的客户重建操作和使用差异感知。

总结


华为云 Stack 已经在某股份制商业银行部署,通过管理区解耦,实现集权管理;在某保险机构通过该方案完成存量演进,保护客户已有投资;在某国有大行,实现集权管理和多区域解耦独立升级。事实证明,将 HCS 的 Global 管理区独立部署,可以有效解决客户对于存量演进、多云合一、集权管理、跨池搬迁等诉求,这个架构,政企客户用了都说好!


点击关注,第一时间了解华为云新鲜技术~

发布于: 7 小时前阅读数: 11
用户头像

提供全面深入的云计算技术干货 2020.07.14 加入

华为云开发者社区,提供全面深入的云计算前景分析、丰富的技术干货、程序样例,分享华为云前沿资讯动态,方便开发者快速成长与发展,欢迎提问、互动,多方位了解云计算! 传送门:https://bbs.huaweicloud.com/

评论

发布
暂无评论
管理区解耦架构见过吗?能帮客户搞定大难题的_云计算_华为云开发者联盟_InfoQ写作社区