第五代英特尔至强可扩展处理器以强劲性能,打造更“全能”的计算
随着第五代英特尔至强可扩展处理器(以下简称“第五代至强”)的问世,其也成为了多年来竞争最激烈的 CPU 市场的一员“大将”。
面对不断变化的市场需求,芯片制造商凭借能够为边缘、云、AI 和科学计算等应用场景打造根据工作负载优化的组件,也因此迎来了巨大的发展机遇。除了 AMD、Ampere Computing 和英伟达以外,主流云服务提供商对定制芯片的依赖性在增强,例如亚马逊的 Graviton 和微软的 Cobalt 等芯片。
在接受 The Register 采访时,英特尔至强产品和解决方案事业部总经理 Lisa Spelman 不仅展示了英特尔数据中心正在以强大的执行力稳步前行,同时也分析了市场环境的变化,以及数据中心处理器产品路线图的发展变化。
持续探索“完美”
第五代至强能够实现平均 20%的性能提升,这在很大程度上要归功于增大三倍的三级缓存和简化的芯粒(chiplet)架构,该架构使用两个 die 而不是上一代的四个。得益于上述变化,第五代至强的核心数提升至 64 个,这相比于主流第四代至强平台的 56 个核心,有了显著的改进。
而这也源于英特尔独特的策略,长期以来英特尔始终优先考虑每个核心的性能而非核心数量,因此与 AMD 也有所不同。但从当下的市场变化来看,尤其是以云端使用场景为例,客户对于高核心数处理器的需求正愈发强烈。
Spelman 表示,“客户几乎不会因为只考虑核心数量而不选择英特尔的产品。但在面临科学计算等对核心数量要求较高的工作负载时,具体还是要取决于客户的实际工作负载和应用程序运行需求,并考虑处理器能否更好地融入现有系统。而且有很多至强处理器的优势是参数规格表无法直接体现的。”
现阶段,英特尔也对多核处理器有所布局。Spelman 指出,“我也正在推动至强产品路线图朝着更高核心数量的方向发展,因为我确实希望能够满足那些客户的需求。而且,如果一切进展顺利,英特尔的首款真正多核 CPU(不包括至强融核处理器)将在核心数量和性能上都极具竞争力。”
代号为 Sierra Forest 的至强处理器计划将在 2024 年上半年推出,其最多将具备 288 个能效核(E-core),比 Ampere One 的 192 核多 50%。性能核(P-core)处理器 Granite Rapids 也将紧随其后发布,尽管现阶段已知信息优先,但可以预见的是,其也将拥有更高的核心数量、改进的性能、以及在内存和 IO 吞吐量上的大幅提升。
“我们正在推出性能核和能效核产品,也是源于我们对于市场发展的持续关注。”Spelman 说。
加码云计算领域
随着越来越多的云服务提供商转向定制芯片,以及 ARM 推进其称为计算子系统(CSS)的 shake-'n-bake CPU 设计,英特尔也在持续加码云计算市场。
作为定制芯片的代表,亚马逊云科技拥有 Graviton GPU,Trainium 和 Inferentia AI 加速器,以及 Nitro SmartNICs,但他们绝非唯一构建自有芯片的公司。在业界讨论了多年之后,微软终于推出了其 Cobalt 100 CPU,该 CPU 的部分基于 ARM 的 CSS 构建模块,并拥有 128 个处理器核心。
值得关注的是微软对 Arm CSS 的使用,这是迄今为止 Arm 架构在 CPU 设计中最趋于完整的体现。而对于 Arm 来说,其目标显然是吸引更多超大规模基础设施运营商和云服务供应商以 CSS 作为基础,进而开发自己的定制化 Arm CPU。
亚马逊云科技和微软并不是唯一选择采用 ARM 核心的公司。据传谷歌正在开发自己的芯片,代号为 Maple,报道称其将使用 Marvell 开发的设计。而甲骨文虽然并未构建自己的定制 CPU,但它在 Ampere Computing 的 ARM 兼容处理器上投入了大量资金。
Spelman 表示,“尽管亚马逊云科技的 Graviton 芯片在 ARM 生态系统拥有“不俗表现”,但我们在云计算领域的前景也无需过于担忧。云服务提供商专注于以最有效的方式解决客户问题,这意味着即使他们有自己的产品,我们的芯片也有可能会被采用。”
英特尔的前瞻规划
尽管如期推进至强产品路线图面临挑战,但 Spelman 表示,一些前瞻性规划,特别是英特尔将 AI 加速功能适配到其 CPU 中的决定,已经初显成效。
Spelman 指的是去年 1 月随着第四代至强共同推出的高级矩阵扩展(AMX)。AMX 旨在加速常见的 AI 和机器学习推理工作负载,并减少对独立加速器的需求。这也是英特尔最新发布的第五代至强的一大特色。第五代至强也对 AMX 加速引擎进行了改进,并拥有更快的内存和更大的缓存。得益于此,第五代至强现在可以以更低的延迟运行更大的模型。
Spelman 指出,“在异构计算时代,市场对于 CPU、GPU、AI 加速期等的需求都同时存在,因此我们也采用‘多条腿走路’的计划。”诚如此前披露的信息,第五代至强能够在可接受的延迟水平下承载参数量多达 200 亿的大语言模型。而对于参数量更大的模型来说,专门的 AI 加速器更为理想。
回顾过往,Spelman 表示对至强团队取得的进展感到满意。“从领导者的角度来看,我现在最大的目标就是保持警惕。”
评论