高性能计算与人工智能何处去?英特尔剑指 XPU
内置高带宽内存(HBM)的 Sapphire Rapids 至强可扩展处理器进一步打造性能标杆;英特尔 GPU、网络和存储能力丰富高性能计算产品组合
新闻要点
最新的第三代英特尔®至强®可扩展处理器将驱动下一代超级计算机和高性能计算系统。
下一代英特尔至强可扩展处理器(代号“Sapphire Rapids”)将集成高带宽内存(HBM)。
基于英特尔 Xe 架构的 HPC GPU (Ponte Vecchio)已成功启动,正在进行系统验证,包括 OAM 规格的产品及其子系统。
英特尔宣布推出基于以太网的高性能网络(HPN),此举将使英特尔以太网扩展到高性能计算应用。
英特尔宣布引入对 DAOS(分布式异步对象存储)的商业支持。
加州圣克拉拉,2021 年 6 月 28 日——在 2021 年国际超算大会(ISC)上,英特尔通过一系列技术披露、重点合作与客户成功案例,全面展现了其在高性能计算领域日益强化的领导地位。目前,英特尔处理器是全球超级计算机中部署最广泛的计算架构,持续助力全球医学探索和科学突破。英特尔还宣布了用于高性能计算与人工智能领域的至强处理器的重大发展,以及用于一系列高性能计算用例的内存、软件、E 级存储和网络技术方面的创新。
英特尔副总裁兼高性能计算部总经理 Trish Damkroger 表示:“为了最大限度地提高高性能计算性能,我们必须尽可能地利用所有计算机资源与技术进步。英特尔是整个行业迈向 E 级计算的重要推动力,而我们在 CPU、XPUs、oneAPI 工具包、E 级 DAOS 存储和高速网络方面的突出优势正在逐步将这一目标变为现实。”
扩大高性能计算的性能领先优势
今年早些时候,英特尔凭借最新推出的第三代英特尔至强可扩展处理器进一步扩大了其在高性能计算的领先地位。相较于前代产品,它能够为广泛的高性能计算工作负载提供高达 53%的性能提升,其中包括生命科学、金融服务和制造等领域。
对比最接近的 x86 竞品,第三代英特尔至强可扩展处理器能够为一系列主流高性能计算工作负载提供更强大的性能。例如,在英特尔®至强®可扩展 8358 处理器和 AMD EPYC 7543 处理器的对比中,至强可扩展处理器的 NAMD 性能表现胜出 62%,LAMMPS 性能表现胜出 57%,RELION 性能表现胜出 68%,二项式选项性能表现胜出 37%。此外,蒙特卡罗(Monte Carlo)模拟在全新的英特尔®至强®可扩展处理器上的运行速度比在 AMD 霄龙处理器上快两倍,这将使金融类公司仅通过一半时间就能实现定价结果。英特尔®至强®可扩展 8380 处理器在关键 AI 工作负载上的性能也优于 AMD EPYC 7763 处理器,在 20 个常见基准测试中都能提供高达 50%的性能提升。全球诸多高性能计算实验室、超算中心、大学及原始设备制造商正在利用英特尔最新的计算平台开发高性能计算解决方案,其中包括戴尔科技集团、HPE、韩国气象局、联想、马克斯·普朗克计算和数据机构(MPCDF)、甲骨文、大阪大学和东京大学。
在下一代英特尔至强可扩展处理器内集成高带宽内存(HBM)
如今,建模和模拟(例如计算流体动力学、气象和天气预报、量子色动力学)、人工智能(例如,深度学习训练和推理)、分析(例如大数据分析)、内存数据库、存储等广泛的工作负载正在显著推动人类的科学突破。下一代英特尔至强可扩展处理器(代号“Sapphire Rapids”)将集成高带宽内存(HBM),可显著提高处理器的可用内存带宽。通过在处理器内封装高带宽内存,运行高性能计算与人工智能应用等内存带宽密集型工作负载的处理器性能将获得大幅提升。集成高带宽内存的 Sapphire Rapids 处理器可在仅使用高带宽内存或结合 DDR5 的情况下处理工作负载。
集成高带宽内存的 Sapphire Rapids 处理器深受客户青睐,目前成功部署在美国能源部在阿贡国家实验室的 Aurora 超级计算机、以及洛斯阿拉莫斯国家实验室的 Crossroads 超级计算机上。
阿贡国家实验室的计算、环境与生命科学实验室副主任 Rick Stevens 表示:“实现 E 级计算需要快速访问和处理海量数据。在英特尔至强可扩展处理器中集成高带宽内存将大幅提升 Aurora 超级计算机的内存带宽,并让我们利用人工智能和数据分析来进行高级模拟和 3D 建模。”
洛斯阿拉莫斯国家实验室的物理学实验室副主任 Charlie Nakhleh 表示:“洛斯阿拉莫斯国家实验室的 Crossroads 超级计算机旨在推动用于科学和国家安全的复杂物理系统的研究工作。下一代英特尔至强处理器 Sapphire Rapids 结合高带宽内存(HBM),将在我们的 Crossroads 系统中大幅提升内存密集型工作负载的性能。[Sapphire Rapids-HBM]产品能够加速目前最大型的复杂物理学和工程运算,让我们能够进行全球安全、能源技术和经济竞争力领域的大型研发项目。”
基于 Sapphire Rapids 的平台将提供独特的功能,为高性能计算提供加速,包括搭配 PCI express 5.0 的更高的 I/O 带宽(与 PCI express 4.0 相比),以及对 Compute Express Link (CXL) 1.1 的支持,从而在跨计算、网络和存储的情况下支持先进用例。
除了内存和 I/O 方面的提升外,Sapphire Rapids 还借助全新内置人工智能加速引擎——英特尔® 高级矩阵扩展 (AMX) ,针对高性能计算和人工智能工作负载进行了优化英特尔 AMX, 旨在显着提升深度学习推理和训练的性能。目前,已经决定采用了 Sapphire Rapids 的客户包括 CINECA、莱布尼茨超级计算中心(LRZ)和阿贡国家实验室,以及洛斯阿拉莫斯国家实验室和桑迪亚国家实验室的 Crossroads 系统团队。
基于英特尔 Xe 架构的 HPC GPU(Ponte Vecchio)已成功启动
今年早些时候,英特尔基于 Xe 架构的 HPC GPU(代号“Ponte Vecchio”)已成功启动,目前正处于系统验证阶段。Ponte Vecchio 是一个基于 Xe 架构的 GPU 产品,为高性能计算和人工智能工作负载进行了优化。Ponte Vecchio 将利用英特尔的 Foveros 3D 封装技术,对多个 IP 进行封装,其中包括 HBM 内存和其它 IP。这款 GPU 的架构包含计算、内存和 Fabric,以满足像 Aurora 这样的全球最先进的超级计算机不断演进的算力需求。
Ponte Vecchio 将会支持 OCP 加速器模块(OAM)规格及子系统,提供高性能计算应用所需的横向与纵向扩展功能。
将英特尔以太网能力注入高性能计算
在 2021 年国际超算大会(ISC)上,英特尔还宣布了其全新的以太网高性能网络 (HPN) 解决方案,该解决方案通过使用标准的英特尔以太网 800 系列网络适配器和控制器、基于英特尔® Tofino™ P4 可编程以太网交换机 ASIC 和英特尔® 以太网结构套件软件的交换机,为 HPC 领域的小型集群扩展以太网技术功能,HPN 能够对以太网提供的易用性进行充分利用,以更低的成本实现与 InfiniBand 相当的应用程序性能。
对 DAOS 进行商业化支持
英特尔正在引入对 DAOS(分布式异步对象存储)的商业支持。DAOS 是一种开源软件定义对象存储,旨在优化跨英特尔高性能计算架构的数据交换。DAOS 同时是阿贡国家实验室此前宣布的英特尔®E 级存储堆栈的基础,被英特尔的 LRZ 和 JINR(联合核研究所)等客户广泛采用。
DAOS 支持现已作为 L3 的支持产品对英特尔合作伙伴开放,这使广泛的合作伙伴能够将完整的交钥匙存储解决方案与服务相结合,持续赋能产业下游。除了英特尔自身的数据中心构建模块,这一新商业支持计划的早期合作伙伴还包括慧与、联想、美超微、Brightskies、Croit、Nettrix、广达和 RSC 集团。
有关英特尔参加 ISC 2021 的更多信息,包括演讲和演示的完整列表,请访问:http://www.hpcevents.intel.com/
有关性能声明,请参阅 www.intel.com/3gen-xeon-config 上的 [43、47、108]。结果可能有所差异。
评论