一文看懂倚天云实例|科普漫画
2022 云栖大会上,阿里巴巴宣布自研 CPU 倚天 710 已大规模应用。
编解码场景实现了 80% 的性价比提升,数据库场景、AI 推理场景、大数据场景也都分别有着 30%、70%、50% 的有效性价比提升。
天猫双 11 核心交易系统平滑迁移至倚天 710 云实例,算力性价比提升 30%;汇量科技广告推理业务使用倚天 710 云实例,性能和网络带宽双双提升,性价比提升 40% 以上。
今天就来说说,这些蹭蹭蹭的性价比提升,阿里云 ECS 倚天实例是怎么实现的呢?
第一个秘密武器是平头哥自研的倚天芯片本身。
倚天 710 芯片采用无超线程的设计,让计算性能更高。
无超线程设计,是不是有点懵?我们先来了解一下计算机的“大脑”CPU 芯片平时是怎么工作的。CPU 里面有两个比较重要的分工:
计算,主要 CPU 核里面的执行单元负责,数量越多往往算得越快,主频则是影响计算速度,越高算得越快;
缓存,则是暂时存数据的歇脚点,比如说你要算 A+B=?,就需要先把 A 和 B 暂时存着,等到算的时候才用上。
后来,技术人员发现,大部分情况,一个应用都用不完一整个物理核,导致 CPU 有很大一分部分是“闲置”的。
于是,就有厂商设计了超线程概念,也就是把一份物理核变成 2 个 vCPU(虚拟 CPU),就可以“同时”运行两个应用进程。传统架构的 CPU 就是这样。
这两个 vCPU,因为是在共用一个物理核和缓存,就会导致来自不同 vCPU 的计算指令要排队被“计算”,同样的缓存里面等待的时候也是一样的。
这样导致的坏处是,因为相互争抢和影响,所以 vCPU 性能波动较为严重,单个进程也因为要排队,计算速度变慢。
无超线程的设计意味着 ECS 倚天实例采用的是独享物理核心方式,这可以让算力密集的计算指令不必排队、不必争抢,计算速度更快。
倚天芯片的 ARM 架构与生产工艺让功耗更小,运算速度更快、更稳定。
倚天处理器采用的是 ARM 架构,采用更精简的指令集,本来功耗就比传统架构低,加上先进制程工艺,倚天 710 的功耗是主流架构的 1/6,优势十分明显。
一般来说芯片制程越小,功耗越小,性能越高。
生产制程指的是芯片表面晶体管的尺寸,宽度越小电流通过时的损耗越小,功耗越小;更小尺寸也意味着在同等面积中可以塞入更多的晶体管,而作为运算芯片的基本组成部分,更多的晶体管数量显然能够提供更好的性能。
加更多的晶体管,要怎么加也是很有学问的。一般来说架构越新性能越高、能力也更丰富。倚天芯片采用的是最新的 ARM v9 架构,比之前提供了更多执行单元,也增加安全性、机器学习等新能力。
除了算得快,倚天还功耗低,意味着成本低。功耗大不仅意味着成本,可能还会影响计算性能的平稳。传统 CPU 架构功耗大,导致计算负载过重时温度上升,为了避免高温造成的功能失效,会主动降低主频,进而影响了性能。倚天就没有任何降频问题。
倚天云服务器性价比高的第二个秘密武器,就是阿里云的数据中心处理器——CIPU。
CIPU 开创了不同的硬件架构,让服务器以 CIPU 为中心。
CIPU 连接 2 颗或者更多倚天的芯片,让多个芯片共享一台服务器,这样降低了成本,使得倚天实例更有竞争力。
同时,各个倚天芯片在各自主板上,一旦某个零件出问题,不会影响同一个机器上的另一张芯片,会让产品更为稳定。这样的设计叫多单路的硬件机型设计。
双路设计,单个 CPU 损坏将波及同一主板的 CPU。
依靠 CIPU 实现双单路设计,低成本+高可用
最后,CIPU 将虚拟化与 IO 转发等数据面卸载到专用硬件上进行加速,消除了原来虚拟化损耗与性能争抢,并大幅加速了 IO,也会使得整体性能更高;VPC 环境下支持弹性 RDMA 加速能力,相比 TCP 时延降低 70% 以上。
评论