天翼云加速落地紫金 DPU 实践应用,让算力供给更高效!
近日,以“智驱创新·芯动未来”为主题的第三届 DPU 峰会在北京成功举办。会上,天翼云凭借紫金 DPU 在架构革新、算力释放、场景落地等多方面的成果,荣膺“2023 芯星品牌奖”,技术实力与品牌影响力再获行业认可。天翼云科技有限公司基础架构事业部高/级产品经理雷晓龙在技术生态论坛发表了题为“天翼云紫金 DPU 产品升级及应用实践”的演讲,分享天翼云以紫金 DPU 为核心的紫金架构,及其在多个算力应用场景中的探索实践,为业界提升计算系统效率、推动算力普惠应用提供了参考。
构建高效算力基础设施
打造新一代云计算体系架构
当前,人工智能、大数据应用进入快速发展阶段,催生海量算力需求,拥有强大集群算力的新型数据中心成为突破人工智能发展瓶颈的突破口。DPU 通过业务卸载和硬件加速,释放主机 CPU 的计算资源,实现任务加速处理,提升算力算效,成为构建新型算力基础设施的重要基础部件。
天翼云作为云服务国家队,一直以来积极加码布局算力新基建,推出了新一代云计算体系架构——紫金架构,通过紫金 DPU 与紫金系列定制硬件、自研云服务器操作系统、云操作系统的深度融合,形成软硬一体的整体解决方案,构成天翼云下一代云计算的算力基础底座。
作为紫金架构的核心,紫金 DPU 完成了虚拟化全卸载、多种业务硬件加速和自研三栈合一高性能网络协议三大技术突破,具有“极/致高性能、虚拟化全卸载、超高可靠性、硬件加速、国产化兼容、安全隔离”六大特点,为企业打造高性能、低延时、高可靠性并且可大规模部署的环境,助力算力基础设施升级。
紫金 DPU 不仅性能卓越,在使用上也更灵活简单,支持统一管控和自动化运维。通过实现对不同产品形态、不同平台的统一管控和相互迁移,提高整体算力基础设施的效率和稳定性。为了应对规模部署所带来的运维挑战,紫金 DPU 提供了丰富的自动化运维工具集,依托这些工具可有效缩短故障分析、故障定位和故障恢复时间,保障用户业务的高可用。
探索三大实践场景
紫金 DPU 促进算力应用降本增效
依托产品技术突破及性能优势,天翼云目前已将紫金 DPU 广泛应用到弹性裸金属、云主机、容器产品等,在越来越多的关键业务场景中落地实践,助力客户真正实现算力应用方面的降本增效。
核心数据库场景是紫金 DPU 应用的重要场景。天翼云弹性裸金属大量部署了数据库实时应用集群,在该场景中,通过应用紫金 DPU 大幅提升网络和存储性能,满足云上核心数据库对于高性能计算能力的要求。从业务总体性能提升来看,在同等配置下,基于紫金 DPU 的弹性裸金属,相比传统裸金属产品在此场景下,性能提升了 30%。另一方面,天翼云弹性裸金属利用存储和网络的“弹性”可实现业务和数据的高可用。
在国产化场景中,紫金 DPU 也有深入实践。紫金 DPU 的物理隔离功能使算力基础设施的兼容性得到大幅提升,可快速兼容不同的算力架构,支持主流芯片的产品化适配和规模部署,并同步适配天翼云自研服务器操作系统 CTyunOS 以及麒麟、统信等国产操作系统,真正做到一云多芯、即插即用,推动国产化算力基础设施发展。此外,在智算场景中,天翼云也在探索通过紫金 DPU 同时实现 VPC/RDMA 网络的接入,将 VPC 网络/存储网络合二为一,实现单卡支持多种网络形态接入,减少设备数量,简化组网方案,降低组网成本,提高可靠性。
在大模型等 AI 技术、应用高速发展的大趋势下,算力需求将持续走高。天翼云将继续坚持科技创新,深挖 DPU 产品潜力,加速 DPU 应用在更广阔的业务场景中,以前沿技术助推产业升级,赋能千行百业数字化转型。
评论