“碳”出新路!天翼云紫金架构给产业发展一点“颜色”!
由广州开发区管委会、黄埔区政府主办、上海浦东新区格物科创金融研究院协办的“2023 粤港澳大湾区绿色计算产业大会”,于 2023 年 11 月 28 日在广州市黄埔区知识城国际会展中心隆重举行。大会主题围绕“绿色计算·驱动未来”进行讨论,向来自全球的与会嘉宾分享、交流了当前数字经济领域前沿的算力技术、人工智能技术以及最新的绿色算力产业的机遇与挑战。天翼云科技有限公司基础架构事业部技术总监刘禄仁参会,分享了天翼云在加速算力底座升级、为数字产业赋能方面的实践。
天翼云科技有限公司
基础架构事业部技术总监刘禄仁
随着“双碳”战略持续推进,我国绿色计算产业发展驶入快车道,新技术、新业态、新模式不断涌现,算力基础设施建设更是呈现出绿色低碳、安全可靠的基本特征。天翼云作为云服务国家队,积极践行绿色发展理念,建设泛在覆盖、架构先进、云网融合、安全可控、绿色低碳、全球部署的新型云网基础设施,目前已形成“2+4+31+X+O”的资源布局架构。
面向新应用与新场景不断涌现所带来的算力需求激增,高性能、大带宽、低时延、低成本几乎已经成为业务对于算力基础设施的刚性要求。天翼云推出了为云而生的新一代天翼云算力架构——紫金架构,以紫金 DPU 为核心,通过与紫金系列定制硬件以及自研云服务器操作系统与云操作系统的深度融合,形成软硬一体的整体解决方案,构成天翼云下一代云计算的算力基础底座。
天翼云自研紫金 DPU 是整个算力架构的核心,能够实现对计算、网络、存储等算力资源的快速云化加速。紫金山计算服务器、紫金湖存储服务器及紫金桥交换机是紫金系列硬件的基石,覆盖了计算、存储和异构等多种场景。天翼云凭借紫金架构“一云多芯”的能力,使不同架构的极致算力得到有效释放,并将国产资源池和多样化算力集群同步纳入云操作系统 TeleCloudOS4.0,实现算力一体化服务,结合绿色、智能、弹性的 IDC 基础设施,为用户提供超高性能、安全可靠、自主可控、绿色低碳的云计算基础设施。
当前,人工智能大模型加速落地应用,智算作为一种 AI 驱动的计算新形态迎来爆炸式增长,以大模型为代表的智算集群,要求算力损耗尽可能少的情况下进行模型的训练推理。天翼云发挥自主创新的技术优势,全面提升智算服务能力,应对 AI 时代下的适配、能耗和散热等算力发展瓶颈。
在异构算力方面,天翼云研发的基于内核虚拟化的容器共享技术,支持多个容器共享一张 GPU 卡,并提供算力、显存、故障强隔离能力,既实现了业务的安全运行,也达到提升 GPU 利用率、降低用户使用成本的目的;推出大模型训练/推理评测标准,快速评测国产 GPU 的性能、功耗以及成本,为快速引入 GPU 芯片打下坚实基础。
在云化算力方面,天翼云通过紫金 DPU,以弹性裸金属的方式对外提供算力,实现虚拟化零损耗;通过大带宽的 DPU 接入,将 VPC 流量以及多个平面的存储访问流量收敛,统一由一个 DPU 来承载。
在高速互联方面,天翼云推出 400G 接入、51.2T 交换的自研 RoCE RDMA 网络,支持多路径流量负载均衡;通过自研 CTCC 拥塞控制算法,提升网络吞吐,保障流间公平。
在绿色低碳方面,推出冷板液冷方案并定制液冷 DC 舱,融合定制化液冷智算服务器,实现低至 1.12 的 PUE,另外通过 IDC 监控系统,持续优化智算 IDC 的能耗,为智算提供整套绿色低碳、灵活高效的算力基础设施。
此外,天翼云还在技术、应用、服务、渠道多个领域持续搭建全方位的生态体系,携手合作伙伴共建繁荣国云生态,共促产业发展。未来,天翼云将持续推动算力基础设施升级,加速绿色算力普惠应用,以坚实国云算力底座助力千行百业转型升级。
评论