Apsara Stack 技术百科|标准化的云时代:一云多芯
芯片作为半导体行业的核心产物,可以说是整个信息时代发展的基础,在人们衣食住行越来越数字化升级的今天,小到工作使用的手机和笔记本,家庭用到的路由器、冰箱、空调、电视,大到交通路网的信号灯系统、车辆的控制系统,都离不开芯片这个“大脑”,通过接收信息和发出指令,维持着整个系统的正常运转。
而在云计算领域,尤其是混合云场景所依赖的通用服务器市场,同时存在着 X86、ARM、RISC-V、MIPS 等多种不同指令集类型的芯片,这就让希望上云和在云上的企业主们犯了难,自己机房里已经有了很多 X86 架构的服务器,未来扩容或新增某些产品时还能不能引入新的芯片架构?企业改变芯片路线只能放弃原有的服务器资产?
一些云厂商给出的是方案将每一种类型的芯片集群都单独建云,在形成多云后通过云管理平台从软件层面进行统一管理。看似是通过多云协作解决了不同芯片架构的问题,但仔细思考下会发现仍然有很多需求无法满足,例如多朵云分资源池化后难以进行资源统一调度,无法充分的利用到不同业务的峰值和低谷来进行弹性,建多云、或多个 AZ 对客户的机房规划、建设预算等都有一定要求,多云的方案并不能解决所有的问题。
除此之外多朵云还会导致运维复杂,包括部署、升级和扩容等需要单独管理、运维管理成本高,租户操作体验差。
针对上述这些痛点,阿里云混合云给出了“一云多芯”的答案。针对客户业务特点及业务发展规划,提供不同维度的混部能力满足客户“多芯”需求。
什么是一云多芯?
所谓一云多芯是指用一套云操作系统来管理不同架构的硬件服务器集群,飞天云操作系统可以将服务器芯片等硬件封装成标准算力,无论底层是 X86 与 ARM 的并存、ARM 不同厂商架构间并存、亦或是计算节点与存储节点不同芯片架构并存时,给客户提供体验一致的云计算服务。简单来说,就是从根本上解决不同类型芯片共存所带来的多云管理问题,真正形成一朵云,最大限度利用云上资源池的强大算力。
一云多芯主要适用的场景有如下两个:1、新建云平台时为了满足合规要求,企业进行强管控规避与单一芯片进行绑定,需要在单机房使用两种及以上类型芯片,或一云多 Region 下主 Region 和单元 Region 使用不同类型芯片;2、已有云平台扩容,满足业务规模增长或新业务上云的需求,需要在云平台扩容新的产品,或者已有的云产品进行扩容,无论是新增产品还是已有产品扩容都可以使用不同芯片;扩容另外一个单元 Region 与已有云平台形成多 Region 架构,或者容灾 AZ 与已有云平台形成同城容灾架构,都支持使用不同的芯片。
一云多芯提供哪些能力?
针对客户不同的业务场景,以不同粒度(产品单集群、产品多集群、AZ、Region、云)划分不同层次的混部能力,提供一云多芯的全栈混合云产品,在功能、性能、可靠性、安全性等使用体验一致的前提下,释放异构多元算力。
在单机房场景中,支持从产品间、产品集群内、产品多集群的混布。1、产品间混布:一朵云内,可支持将不同产品部署在不同的芯片上,例如根据业务需求可以在 OSS 和 RDS 等云产品上分别部署不同类型芯片;2、多集群混布:一个产品如果有多个集群,可支持不同集群支持部署不同的芯片上,用户使用/创建资源时可以选择不同的芯片集群;3、集群内混布:集群内支持部署在不同的芯片上,由系统自动调度,租户无需感知硬件类型,更易于管理或者业务扩容。
在多机房场景中,针对典型的一云多 Region 场景和同城容灾场景提供支撑。1、多 Region 混部:主 Region 和单元 Region 选择不同的芯片进行部署,适合在多个地区有分公司的集团型或大型企业 ;2、多可用区混部:多个可用区支持使用不同芯片建设,组建同城容灾混部,每个可用区可以部署一种芯片,是业界首家实现一云多 Region 的多集群的复杂场景的混布。
除混布能力外,对于一云多芯的云平台来讲,环境底层硬件、上层操作系统和软件都是异构多样化的,期间任何一个环节的细小问题,都可能影响一云多芯生产环境使用,如何做到正确识别,有效管理,进而达成高效协同是相当大的挑战,为了寻求在稳定性与性能间的最佳平衡,阿里云混合云团队坚持从底层到上层的各项功能调试优化,专业保障前期验证适配工作,使生产环境可以快速就绪。
结语随着今年云栖大会现场平头哥的自研云芯片倚天 710 发布,以及众多新兴厂商的芯片发布,将有越来越多的类型芯片进入到主流市场,“多芯”的架构将在数据中心中越来越常见,阿里云混合云在安全和稳定的基础上,将“多芯”的差异转变为“一云”的标准化云服务,助力企业业务跑的更快、更稳。
评论