写点什么

云脉芯联自研 RDMA 技术成果公开亮相 ODCC 峰会

作者:科技热闻
  • 2022 年 9 月 07 日
    浙江
  • 本文字数:1384 字

    阅读完需:约 5 分钟

9 月 5 日,2022 开放数据中心(ODCC)峰会在北京国际会议中心拉开帷幕,本次峰会以“畅享算力精彩 共赴低碳未来”为主题,政府主管部门领导、行业机构、知名企业等各方重量级嘉宾出席了本次峰会,共同探讨东数西算、服务器、数据中心网络、边缘计算、数据中心安全等重点话题,展示最新创新应用,献策数据中心产业高质量发展。



图|2022 开放数据中心峰会

作为未来数据中心的网络核心、算力提升的关键器件——智能网卡(DPU)也成为了本次峰会关注的热点之一。国内 DPU 头部研发企业云脉芯联受邀出席参展,并通过现场测试方式展示了其自主研发的基于智能网卡(DPU)的 RDMA 技术成果,这也是国内自研 RDMA 技术和可编程拥塞控制算法平台的首次对外公开亮相。



图|云脉芯联展台前工作人员与用户交流

RDMA,即 Remote Direct Memory Access,是一种直接内存访问技术,它将数据直接从一台主机内存传输到另一台主机,数据从一个系统快速移动到远程系统内存中,无需双方操作系统介入,不需要经过 CPU 的耗时处理。

RDMA 对比传统 TCP 传输方式在提升吞吐、降低 CPU 利用率、降低延时方面均有明显的优势。随着网络进入 100G 以上带宽,传统 TCP 协议栈内核转发已经无法满足高性能要求,具有高吞吐、低延时特性的 RDMA 技术将承担基础的网络传输功能,在提升数据中心整体算力上发挥重要的作用。

为了更好的实现 RDMA 高性能、低延时的技术优势,需要端到端的拥塞控制来避免拥塞和降低网络延时,因而 RDMA 的研发具有很高的技术门槛。

云脉芯联自去年成立以来,不断在技术研发上创新突破。目前,云脉芯联 DPU 产品技术升级迭代工作进展顺利,研发团队已完成了 RDMA 关键技术的功能验证,包括自研驱动到标准 VERBS 接口及 PerfTest 应用的全面打通,并且在 RoCEv2 协议层面完成了和业界主流商用 RDMA 网卡的对接。同时,基于云脉芯联自主研发的 HyperdirectTM 技术,实现了 GPUDirect RDMA 功能,并与业内主流 GPU 对接成功,有效提升了整体算力能力。

近期,云脉芯联也携手国内顶尖数据中心解决方案提供商,在智能无损数据中心解决方案架构中部署了智能网卡(DPU)产品 metaFusionTM-50,并进行了 RDMA 规模流控测试,验证了可编程拥塞控制算法在规模组网和复杂流量模型下的无损效果,时延和吞吐指标均满足预期。



图|云脉芯联展台自研 RDMA 技术现场测试及成果展示

在峰会现场,云脉芯联向到会嘉宾展示了其可编程拥塞控制算法的性能及稳定性。测试工程师依照云数据中心的标准架构,搭建了包括若干台服务器和交换机在内的网络集群,并模拟数据中心典型的 RDMA 流量模型,构造了包括 Incast、Full-mesh 在内的多种拥塞模型,对 metaFusionTM-50 智能网卡(DPU)、RDMA 软硬件以及可编程拥塞控制算法持续压测。在峰会参展的 48 小时内,整个测试集群始终保持零丢包、满带宽、低延迟的性能指标,测试表现优异。



图|云脉芯联创始人 &总裁吴吉朋

此外,云脉芯联创始人 &总裁吴吉朋在峰会上发表了题为《融合、开放、极致——DPU 的未来之路》的演讲,详尽阐述了云脉芯联基于 DPU 产品的“TOP 创新理念”,即“融合互联-Converged Transport”、“开放平台-Open Platform”以及“极致能效-Hyper Performance”,为未来 DPU 产品的发展路径指明了方向。吴吉朋坦言:DPU 不仅预示着数据中心架构的变革,它也同步带来性能、功耗和安全的优化,由于 DPU 可重新分配算力和优化算力资源,更带来了新的数据中心创新范式和经济价值上的提升,这也赋予了 DPU 更多新的使命。紧紧把握好 DPU 带来的重大时代机遇,我们相信在大芯片领域一定会实现重大突破,未来可期!

用户头像

科技热闻

关注

还未添加个人签名 2021.05.31 加入

还未添加个人简介

评论

发布
暂无评论
云脉芯联自研RDMA技术成果公开亮相ODCC峰会_科技热闻_InfoQ写作社区