32 核打赢 AMD64 核 英特尔 Ice Lake 为 HPC 提供强劲性能
众多客户选择英特尔以加速研究并解决科技挑战
从工作站、云到全球 Top500 超级计算机,英特尔一直是高性能计算的坚实基础。在近日举行的 2020 年超级计算大会(SC20)上,英特尔副总裁兼高性能计算部总经理 Trish Damkroger 展示了英特尔及合作伙伴通过软、硬件技术来加速先进高性能计算系统广泛部署,共同塑造高性能计算的未来。
英特尔在 2020 年超级计算大会上主要亮点:
. 更高的内存带宽、全新的核心架构、更多的处理器核数以及更快速的输入/输出:即将推出的第三代英特尔®至强®可扩展处理器(代号“Ice Lake”)将为高性能计算工作负载提供更高性能。
.马克斯·普朗克计算和数据中心(Max Planck Computing & Data Facility)以及韩国气象厅等客户都选择第三代英特尔至强可扩展处理器来加速高性能计算应用。
.美国阿贡国家实验室(Argonne National Laboratory)利用英特尔® Xe-HP GPU 和英特尔® oneAPI 工具包来加速 E 级计算应用的开发。
. AWS、Penguin Computing 和 Advantech 等合作伙伴已通过认证,来部署针对高性能计算优化的英特尔®精选解决方案,帮助客户部署和管理高性能计算工作负载。
加州圣克拉拉,2020 年 11 月 17 日——在 2020 年超级计算大会上,英特尔重点展示了公司如何通过软硬件技术塑造高性能计算的未来。全球范围内,诸多企业选择英特尔® XPU(CPU、GPU、FPGA 和加速器)和 oneAPI 编程环境,来加快先进计算系统的开发和部署。
第三代英特尔®至强®可扩展处理器(代号“Ice Lake”)
在 2020 年超级计算大会的主题演讲中,英特尔副总裁兼高性能计算部总经理 Trish Damkroger 着重介绍了英特尔即将推出的 Ice Lake 服务器处理器,它将为广泛的高性能计算工作负载提供性能优化的功能。通过更高的内存带宽、新的高性能 Sunny Cove 核心架构、更多的处理器核数,以及对第四代 PCIe 的支持,Ice Lake 处理器将帮助客户解决包括生命科学、材料科学和天气建模等多个学科的科学挑战。
早期测试表明,对比搭载 64 核处理器的竞品 x86 系统,采用 32 核双路系统的 Ice Lake 处理器能够以一半数量的处理器内核为特定工作负载提供更高的性能。对比搭载比 32 核 Ice Lake 处理器系统多一倍处理器内核的竞品 x86 系统,生命科学和金融服务应用类客户会在 NAMD 分子动力学模拟(最高 1.2 倍)①、蒙特卡罗模拟(最高 1.3 倍)②和 LAMMPS 分子建模模拟(最高 1.2 倍)③等工作负载上都获得更高的性能。
诸多客户正在采用 Ice Lake 来满足自身对新一代高性能计算的需求,包括:
.韩国气象厅将 Ice Lake 服务器处理器应用于其 5 号超级计算机中,该系统能够实现每秒 50 千万亿次浮点运算,帮助研究天气和气候变化,并实现比当前系统更可靠、更具可行性的预测。
. 马克斯·普朗克计算和数据中心将在其全新的 Raven 系统中采用 Ice Lake。Raven 系统可实现每秒 9 千万亿次浮点运算,能够支持物理学、生物学、理论化学等领域的突破性研究。
. 日本国家工业科学技术研究所将在其 AI 数据中心楼内新增的 AI 桥接绿色云基础设施系统中采用 Ice Lake。预计,该系统的半精度浮点运算峰值将达每秒 850 千万亿次。
. 东京大学和大阪大学是首批采用 Ice Lake 的日本大学。东京大学每秒达 2 千万亿次的浮点运算系统和大阪大学每秒达 2.8 千万亿次的浮点运算系统,将主要用于综合研究和数据分析。
. 甲骨文将在其甲骨文云基础设施内部署 Ice Lake,运行 X9 Generation 高性能计算云实例,适用于碰撞模拟、抗震分析和电子设计自动化等计算密集型工作负载。
此外,Damkroger 还重点介绍了一些近期的超算项目,这些项目利用英特尔最新的至强处理器、即将面世的至强处理器、内存和人工智能技术来推动科学研究:
.巴塞罗那超算中心采用英特尔®傲腾®持久内存和至强可扩展处理器,以加速采用异构内存架构的高性能计算应用。该中心的研究员发现,傲腾持久内存不仅功耗比 DRAM 低 10 倍,还能够让多个应用的性能实现双位数提升。
. LIQID 和英特尔正携手为美国国防部提供全球最大的组合式超级计算机。采用英特尔至强铂金 9200 处理器的 LIQID 的平台,主要用于为美国国防部的人工智能工作负载按需创建软件定义服务器,并能够提升资源利用率和 AI 性能。
英特尔 Xe-HP GPU 为美国阿贡国家实验室开辟通向 E 级计算之路
在 2020 年超级计算大会上,英特尔和美国阿贡国家实验室(Argonne National Laboratory)宣布双方将基于英特尔 Xe-HP 微架构的 GPU 和英特尔 oneAPI 工具包,共同设计和验证 E 级应用。阿贡国家实验室的开发者采用英特尔最新的异构计算编程环境,以确保科学应用能够支持正在部署的 Aurora 超级计算机的规模和架构。
Xe-HP GPU 为阿贡国家实验室提供了面向英特尔 Xe-HPC GPU(“Ponte Vecchio”)的开发工具,后者将被应用于 Aurora 系统。
更多信息请阅读“英特尔和阿贡国家实验室的开发者开辟通向E级计算之路”
面向高性能计算的英特尔®精选解决方案
英特尔近期宣布,数家新的合作伙伴已经验证并正在提供采用了英特尔精选解决方案的高性能计算优化解决方案,这些合作伙伴包括:
. AWS 宣布将面向模拟和建模的英特尔精选解决方案集成到其 ParallelCluster 环境中。利用英特尔优化的环境,客户可以在 AWS 上轻松创建高性能、按需自动扩展的集群。该英特尔精选解决方案已经在 AWS 的 c5n.18xlarge、m5n.24xlarge 和 r5n.24xlarge 实例上进行了验证。
.Penguin Computing 正在部署面向高性能计算和 AI 融合集群的英特尔精选解决方案,使客户能够满足越来越高的同时运行 AI 和高性能计算工作负载的需求。
. Advantech 携手英特尔与 GARAOTUS,为客户提供 Advantech SKY-5240。Advantech SKY-5240 满足了基因组学应用的高性能计算需求,并已经通过验证,成为面向基因组分析的英特尔精选解决方案。
欲了解有关英特尔参加 2020 年超级计算大会的更多信息,请访问Intel.com。
性能因使用、配置和其他因素而异。更多信息请访问 www.intel.com/PerformanceIndex 。性能结果基于截至配置中显示的日期的测试,可能无法反映所有公开可用的更新。有关配置的详细信息,请参见备份。任何产品或组件都无法提供绝对的安全性。成本和结果可能有所差异。英特尔技术可能需要支持的硬件、特定软件或服务激活。英特尔不控制或审核第三方数据。请咨询其他资源以评估准确性。
①NAMD 分子动力学模拟: 2S 第三代英特尔至强可扩展处理器(Ice Lake):单节点,2 个预生产的第三代英特尔至强可扩展处理器(Ice Lake – 2.2GHz,每个插槽 32 个核心),英特尔参考平台,256GB、16x16GB 3200MHz DDR4,超线程启用,TURBO 启用,SNC 禁用,SSDSC2KG96 960GB,BIOS SE5C6200.86B.0017.D92.2007150417,微代码 0x8c000140,CentOS Linux 7.8, 3.10.0-1127.18.2.el7.crt1.x86_64,使用 Intel C Compiler 2020u2 编译,英特尔数学内核库,NAMD:2_15-Alpha1,由英特尔于 2020 年 9 月 17 日进行测试。2S AMD EPYC 7742:单节点,2 个 AMD EPYC 7742(2.25GHz,每个插槽 64 个核心),Supermicro 平台,16x16GB 3200MHz DDR4,SMT 启用,Boost 启用,NPS=4,SSDSC2KG96 960GB,BIOS2.0b dt 11/15/2019,微代码 0x8301025,CentOS Linux 7.7.1908,3.10.0-1127.13.1.el7.crt1.x86_64,使用 AOCC 2.2 编译,英特尔数学内核库,NAMD:2_15-Alpha1,由英特尔于 2020 年 9 月 10 日进行测试。
② 蒙特卡洛模拟:2S 第三代英特尔至强可扩展处理器(Ice Lake):单节点,2 个预生产的第三代英特尔至强可扩展处理器(Ice Lake – 2.2GHz,每个插槽 32 个核心),英特尔参考平台,256GB, 16x16GB 3200MHz DDR4,超线程启用,TURBO 启用,SNC 禁用,SSDSC2KG96 960GB,BIOS SE5C6200.86B.0017.D92.2007150417,微代码 0x8c000140,CentOS Linux 7.8,3.10.0-1127.18.2.el7.crt1.x86_64,使用 Intel C Compiler 2020u2 编译,英特尔数学内核库 2020u2,英特尔开发的 Monte Carlo FSI Kernel 工作负载,由英特尔于 2020 年 10 月 9 日测试。2S AMD EPYC 7742:单节点,2 个 AMD EPYC 7742(2.25GHz,每个插槽 64 个核心),Supermicro 平台,16x16GB 3200MHz DDR4,SMT 启用,Boost 启用,NPS=4,SSDSC2KG96 960GB,BIOS2.0b dt 11/15/2019,微代码 0x8301025,CentOS Linux 7.7.1908,3.10.0-1127.13.1.el7.crt1.x86_64,使用 Intel C Compiler 2020u2 编译,英特尔数学内核库 2020u2,2,英特尔开发的 Monte Carlo FSI Kernel,由英特尔于 2020 年 7 月 17 日测试。
③ LAMMPS 分子建模模拟(原子流体,铜,液晶,聚乙烯,蛋白质,斯蒂林格-韦伯,特索夫和水的几何平均值):第三代英特尔至强可扩展处理器(Ice Lake)单节点,2 个预生产第三代英特尔至强可扩展处理器(Ice Lake – 2.2GHz,每个插槽 32 个核心),英特尔参考平台,256GB, 16x16GB 3200MHz DDR4,超线程启用,TURBO 启用,SNC 禁用,SSDSC2KG96 960GB,BIOS SE5C6200.86B.0017.D92.2007150417,微代码 0x8c000140,CentOS Linux 7.8,3.10.0-1127.18.2.el7.crt1.x86_64,使用 Intel C Compiler 2020u2 编译,英特尔数学内核库 2020u2,LAMMPS 03/03/2020,由英特尔于 2020 年 10 月 9 日测试。2S AMD EPYC 7742:单节点,2 个 AMD EPYC 7742(2.25GHz,每个插槽 64 个核心),Supermicro 平台,16x16GB 3200MHz DDR4,SMT 启用,Boost 启用,NPS=4,SSDSC2KG96 960GB,BIOS2.0b dt 11/15/2019,微代码 0x8301025,CentOS Linux 7.7.1908,3.10.0-1127.13.1.el7.crt1.x86_64,使用 AOCC 2.2 编译,LAMMPS 07/21/2020,由英特尔于 2020 年 8 月 19 日测试。
评论