软硬协同造就极致性能 天翼云紫金 DPU 打造为云而生的全新一代云计算体系结构
算力作为数字经济时代的新生产力,已成为推动数字经济发展的核心动能和坚实底座。在当前这个算力普惠、万物互联的时代,业务场景复杂化,传统以 CPU 为核心的计算架构面临着诸多挑战。
12 月 29 日,在中国电信主办的“2022 天翼数字科技生态大会”,中国电信正式发布天翼云自研紫金 DPU。在科技创新合作论坛上,天翼云科技有限公司副总经理兼首席技术官广小明表示,天翼云紫金 DPU 软硬协同造就极致性能,打造了为云而生的全新一代云计算体系结构,全面推动算力普惠,服务于千行百业上云用云。
创新算力架构 DPU 持续走热
随着各行业数字化转型加速、数据爆发式增长,计算需求不断走高,业务场景也愈加复杂化,而传统以 CPU 为核心的计算架构已无法满足随时随地的计算需求。近年来摩尔定律放缓,CPU 性能提升速度难以满足算力需求的增长速度,主机 CPU 计算能力一部分用于承载虚拟化应用,这将损耗超过 30%的算力,同时 CPU 芯片架构、操作系统种类繁多导致适配难度高、工作量大。这样的行业现状呼唤新型高性能计算架构的产生,来推动算力普惠发展,DPU 正是在这样的背景下诞生。
DPU 可实现业务与基础设施的操作分离、卸载网络、存储和安全等算力,并实现性能大幅提升,支持计算和存储分离等。 随着东数西算工程的推进,以及数字新基建的提速,算力需要不断下沉,而 DPU 可提升计算效能,实现算力资源优化。另一方面,DPU 所涉及的行业广泛,落地应用场景正从数据中心领域逐步向网络安全、网络存储、智能驾驶等领域拓展。在以上双重因素驱动下,DPU 在国内不断升温。
广小明表示,云厂商既是 DPU 需求方,也是设计方。近年来以大规模视频处理、批量数据处理等为代表的高负载云计算应用越来越多,且业务场景运算强度大、高并发、应用复杂,这对云厂商的服务能力提出了极高要求。随后,国内云厂商纷纷踏上 DPU 研发之路。
作为云服务国家队,天翼云是较早探索 DPU 的云厂商。在研发方面,天翼云深知 DPU 的打造不只是系统架构的巨大变化,更需要软硬件之间的深度协同,因此结合当前业界主流的技术方案,以及运维、可扩展性等方面的实际情况,发力 DPU 自主研发。
三大技术突破 天翼云紫金 DPU 全面提升算力算效
凭借在云领域的成熟技术和应用实践,天翼云经过一年多的研发攻坚,推出了完全自研的紫金 DPU 芯片,并且以紫金 DPU 为基础打造了为云而生的全新一代云计算体系结构,将计算、存储、网络和安全算力迁移到完全自研的软硬结合体系中,构建了面向不同算力、全国产化自主可控的第二平面。
基于天翼云全自研能力,该架构完成了虚拟化全卸载、多种业务硬件加速和自研高性能网络协议三大技术突破。
一是虚拟化全卸载。天翼云紫金架构将原运行在服务器 CPU 上的各类虚拟化组件卸载至紫金 DPU,实现了服务器虚拟化零损耗,全面释放了算力,不仅提高了弹性云主机的售卖效率,而且全新支持弹性裸金属服务,实现降本增效,普惠客户。
二是多种业务硬件加速,具备更高的性能和更低的时延。相比传统 CPU 依靠纯软件的处理方式,紫金 DPU 通过芯片级的硬件加速,网络 PPS 性能提升 100%;存储 IOPS 性能提升 200%,网络时延降低 300%。新架构的整体性能实现大幅提升,为客户带来了更好的产品体验。
三是提供高性能网络协议。天翼云紫金 DPU 将高性能网络数据面、NVMe-oF 协议、EC 纠错码等功能全面硬件化,自研的拥塞控制算法通过端网协同的主动控制做到精准流控,通过低队列深度实现超低时延,大幅提升分布式计算通信效率,并且具有可大规模部署的优势。同时,紫金 DPU 还实现了主机 CPU 环境与虚拟化环境的物理隔离,支持“一云多芯”,对于主机不同 CPU 芯片架构的服务器实现“即插即用”。
DPU 应用范围广,未来发展可观,其作为新赛道在我国尚处于发展的起始阶段,DPU 能否规模化应用,有赖于产业的规范化和标准化。广小明认为,DPU 产业的标准应从电器结构标准、软件标准、芯片功能标准等方面着手综合考量,天翼云将同业界共建一个标准化组织来推动相关标准的制定和出台。
目前我国数字经济发展呈现迅猛之势,各行业对算力的需求持续增长。天翼云紫金 DPU 全面释放算力的同时,将对软硬件系统带来创新变革,推动千行百业的业务层数字化应用更流畅、更绿色,助力企业数字化转型升级,推动数字经济与产业高质量发展。
评论