联想,让 AI 计算发生“钟摆革命”

科技史上有一个里程碑式的事件,被产学各界称为“钟摆革命”。
21 世纪初,英特尔在 CPU 领域启动了制程工艺和核心架构两条路线交替进行革新的 Tick-Tock 战略,从而实现了每一年都有重大技术升级,确保摩尔定律的价值最大化,让最严苛、增长速度最快的产业需求也能获得技术上的满足。这一战略的成功,让信息革命成为第三次工业革命,让人类在一次次“钟摆”的声响中,昂然走入了计算世界。
穿越时间迷雾,我们来到了 AI 世界的大门前。大模型的诞生与成熟,让各个行业对 AI 计算的渴求不断高涨,但作为新时代基础设施的 AI 计算,却一直难以拿出足够具有说服力的升级频率与升级幅度。如果 AI 世界有木桶理论,那计算似乎正在变成那个短板。
这种情况下,联想似乎想让世界听一听,那久违的,来自 AI 计算体系内部的“钟摆声”。
5 月 7 日,联想中国基础设施业务群在联想创新科技大会(Lenovo Tech World 2025)上推出了六大创新技术与两大重磅升级。这是去年同一舞台发布五大创新技术后,联想面对用户需求快速变化做出的最新回应。

六大创新技术,覆盖了算力性能与效能、核心算法、算力服务等多个维度,覆盖了用户对 AI 计算各个环节的升级需求。联想集团副总裁、中国基础设施业务群总经理陈振宽基于这六大技术创新,宣布了两大重磅升级:联想万全异构智算平台 3.0 版本,联想 AI 基础设施从计算力、存储力到运载力的全线升级。
联想能够持续进行系统化、多维度 AI 计算创新的内核,是联想认为 AI 算力必须对齐 AI 算法的升级速度,对齐用户需求的快速变化。“宁在一思进,莫在一思停”,只有让 AI 计算能够持续升级,能够在各个环节中萃取出进步空间,AI 算力的飞轮才能转动、前进,并最终驱动 AI 世界这个庞然大物完成前行。
让我们透过这六大升级,读懂联想在 AI 时代的基础设施战略,读懂发生在 AI 计算深处的“钟摆革命”。

在大模型驱动的 AI 浪潮面前,每一家企业都需要越过 AI 计算的山丘。时间进入 2025 年,以 DeepSeek 为代表的开源大模型,确实证明了可以通过多头潜在注意力(MLA)、混合专家架构(MoE)等算法实现方式降低 AI 算力需求。但伴随大模型的普及,各行业都看到了 AI 进入规模化落地阶段的可行性。于是对 AI 算力的需求更加广阔和复杂,AI 算力用户主体的类型也在变得更加多元。
如果说,此前 AI 算力难关只是少数科技巨头需要面对的高山;那么在今天,AI 算力就是各行业普遍面临的,复杂多样、蜿蜒崎岖的崇山峻岭。整体而言,AI 计算的新需求呈现出这样一些显著变化:

1.超大 AI 计算集群提上日程。五万卡、十万卡集群带来了全新的挑战,存、算、网的综合能力成为关键。
2.更多用户拥抱 AI。随着更广泛用户加入 AI 应用落地的机遇中,对 AI 计算的训推算力、推理部署能力提出了多维度的考验。
3.本地化部署成为新趋势。在大模型的快速落地阶段,更多用户倾向于选择模型与算力的本地化部署,这为基础设施创造了全新的机遇与挑战。
这些变化,就发生在过去短短的半年到一年时间中。这种需求的极速升级,客观上考验着 AI 算力供给侧的持续创新与体系化创新能力。只有在每个环节都满足用户需求,实现 AI 算力更优质的计算效率、用户体验与能效,才能让 AI 算力与 AI 世界同步进化。
面对这样的崇山峻岭,联想希望通过构建更强大、更高效、更稳定、更绿色的混合式基础设施,加速 AI 价值的充分释放。

“要让基础技术的进步,比用户需求升级更加超前。”这是钟摆战略成功的内核,也是颠扑不破的科技进步真相。
为了契合计算集群规模、用户需求、部署方式等多个维度的全新变化,联想实践了从算力性能、核心算法、液冷等多个维度的再次升级。
针对大模型引发的推理需求爆发,联想创新推出了 AI 推理加速算法集。算法集结合了 MLA-多头潜在注意力机制、投机推理等业界新兴方法,以及联想长期优化的混合精度量化、分布式并行等算法,为推理加速打造强大的工具箱,助力用户突破推理性能极限,实现 AI 推理性能提升 5-10 倍。同时,相对于业界最优的社区方案,联想的 AI 推理性能保持 20%以上的优势。
针对各个行业对大模型后训练与推理结合的前沿需求,联想推出了 AI 编译优化器。优化器在训练或推理过程中能够自动化替换高效算子、优化计算路径,并进行自动重编译,大幅简化复杂的 AI 计算过程,在提升 AI 训推效率的同时,还实现了降低训练和推理计算开销各 15%以上。

面对大规模 AI 计算集群的运维需求,联想首创了 AI 训推慢节点故障预测与自愈系统。通过对集群异步实时状态监测与全面故障分析,以 AI 预测 AI 故障,在节点性能下降前发现问题,并自动化解决故障,实现故障自愈时间控制在百卡秒级、千卡分钟级、万卡十分钟级。
面向 AI 计算集群不断提升的网络能力需求,联想推出了专家并行通信算法,通过对通信计算原语、访存方式和网络路由算法的协同优化,实现了推理延时降低 3 倍以上,网络带宽利用率从 50%提升至 90%。
以上这些能力,集成在了最新的联想万全异构智算平台 3.0 版本当中,带来了业界领先的 AI 算力实践效果。

在 AI 计算本身的效率提升之外,AI 算力相关能效比问题也日益受到关注,液冷技术正成为 AI 计算的必选项。在液冷领域,联想推出了“飞鱼”仿生散热设计,成功突破了散热器性能瓶颈,最大支持功耗提升 20%;同时,联想还发布了“双循环”相变浸没制冷系统,通过创新的外接单相换热器设计,实现散热能力较传统方案翻倍提升,系统 PUE 低至 1.035。
在算力服务方面,联想推出了“成本-效能”双优运营系统,帮助提升用户运营效能,优化运营成本。
通过看到用户在 AI 集群升级、推理需求加重、能效与运营需求变得更加复杂等等需求变化,联想基于各个领域的技术积累,完成了高效率、多维度、有针对性的技术创新。
AI 计算的崇山峻岭,只能靠技术创新来飞跃。当我们认识到别无他法的时候,也就走在了正确的方向。

从技术创新到产业价值落地,需要依靠产品作为媒介与桥梁。为此,联想希望构建 AI 算力满天星,对 AI 基础设施进行全线的产品升级。
总结联想的 AI 集成设施产品升级,核心点是“三重发力”。

在计算力层面,联想重磅推出基于英特尔®至强®6 处理器的全新算力服务器家族,包括联想问天 WA7880a 家族在内的 AI 训练算力服务器家族、联想 ThinkSystem SC750 V4 在内的数据处理算力服务器家族;联想问天 WA5480 G5、WR5220 G5、联想 ThinkSystem SR650 V4、SR650a V4、SR630 V4 在内的推理应用算力服务器家族,面向不同的 AI 应用场景充分释放 AI 服务器的算力潜能。

在存储力层面,联想最新发布了凌拓全新存储产品家族,以及具备本地自研、自有知识产权、自主可控三大特征的联想存储新品牌联想问天。联想凌拓从数据管理到存储架构均进行了全方位升级,包括联想问天 DXN AI 存储解决方案、DXN2000 系列、DXN 全闪系列,Lenovo ThinkSystem DE/DM/DG 系列、NetApp ASA/AFF/FAS 系列、AIPod DeepSeek 一体机在内的联想凌拓全新存储产品家族,满足 AI 存储时代各个行业的需求。
在运载力层面,联想通过 RoCE/IB 多架构融合及低延迟优化技术,构建了覆盖多种规模 AI 算力集群的智能网络体系。其数据网络产品兼容多种主流 AI 网络架构。最新发布的高密度 400G 交换机联想问天 NE8770-64QC 专为 AI 场景深度优化。同步亮相的还包括两款战略级新品——面向下一代融合网络的多业务核心交换机联想问天 NE7550G-8C,以及支持超大规模组网的新一代高性能核心交换机联想问天 NE9770G-4C。
此外,在软件及超融合领域,联想还升级了 AIO V6 系列产品和联想问天 WX 系列虚拟化超融合 8.0.2 版本。联想 AIO 超融合解决方案已实现 2000+企业级客户部署,累计支撑超 20000 个核心业务系统平稳运行。
全面突破计算力、存储力、运载力的性能极限,打造覆盖训练、训推一体、推理、边缘推理全场景的 AI 基础设施。联想的技术创新能力,由此贯穿到用户需求当中,帮助千行百业实现越过 AI 山丘的算力之舞。

从一台 AI 一体机,到国家级的 AI 计算集群;从工厂里的“实业兴邦”,到实验室中的“大国重器”。联想在 AI 计算中完成的“钟摆革命”式技术升级,已经成为众多行业进入 AI 世界的捷径。
在国家级高质量 AI 集群场景中,联想与“东数西算”第一大智算枢纽紧密合作,在千卡训练场景中将 MFU 从 30%提升至 60%;
在行业级 &科研级智算场景,联想与北大深度配合,共同打造了重大科技基础设施算力平台,减少运维成本 50%,GPU 资源利用率从 70%提升至 90%;
在制造业,联想与吉利共同打造了标杆级的智能算力集群,实现企业混合算力场景下的成本优化;
面向模型本地化部署需求,联想通过万全异构智算平台调优的 DeepSeek 大模型一体机持续升级,全面支持国内+国际主流 GPU 芯片生态,实现了业界领先。

正视 AI 算力需求的变化,之后以技术创新为起点,以产品升级为通道,以行业场景为结果。联想的 AI 基础设施战略,在这样的逻辑闭环下高效运转,如车轮飞驰般启动着一场“钟摆革命”。

在信息革命的历史上,“Tick-Tock 战略”扮演着极其重要的角色。这个战略的启动,倒逼了整个产业加速信息技术创新,同时也让用户开始使用在技术极速进化下,用更快、更强的姿态释放应用侧的创新能力。
一个发条的飞速转动,将带动整个齿轮体系的加速。过去如此,联想在今天所做的 AI 基础设施探索同样如此。
之所以能够确保 AI 计算各个环节技术的准确创新,根源于联想在去年启动的“一横五纵”战略。通过万全异构智算平台的布局,以及五大产品维度的全面布局。联想才有能力将各个环节的 AI 基础设施创新综合起来,高效释放,让 AI 计算与 AI 产业需求同频进化。

(联想集团副总裁、中国基础设施业务群总经理陈振宽)
陈振宽表示,“此次六大创新技术的发布与两大重磅升级,是联想中国基础设施业务群坚持“一横五纵”战略布局的成果。未来,我们将继续深挖技术创新潜力,积极构建生态,通过打造持续迭代的混合式基础设施,致力于成为加速中国本地 AI 持续发展的技术引擎”。
启动的 AI 计算飞轮,将带动技术、产业,乃至各个行业 AI 应用的彼此砥砺与竞相提速。
持续进化——是联想带给 AI 基础设施的答案,也是 AI 时代的唯一出路。

版权声明: 本文为 InfoQ 作者【脑极体】的原创文章。
原文链接:【http://xie.infoq.cn/article/f78a49c5131a465c1ee87c6e3】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论