写点什么

国际最新 AI 算力评测标准 SPEC ML 即将发布

作者:财见
  • 2024-02-26
    北京
  • 本文字数:1058 字

    阅读完需:约 3 分钟

国际权威标准性能评估组织 SPEC 第 35 届年会日前在美国举行。会上,SPEC 组织确定新一年工作计划,为推动 AI 算力产业的更快发展,国际最新 AI 算力评测标准 SPEC ML 即将发布,该标准由浪潮信息、NVIDIA、Intel、AMD、Red Hat 等成员联合开发。

与业界一般 AI 算力评测标准不同,「国际最新 AI 算力评测标准 SPEC ML」模拟了 AI 训练和推理不同场景的端到端全栈流程,涵盖业界最丰富的主流 AI 工作负载,评估包括多个 AI 场景的综合性能、集群扩展性、能效等多种关键参数,可以帮助用户更好地理解算力系统的瓶颈并进行优化,是一款更贴近用户真实 AI 业务需求的算力测试基准。目前,浪潮信息、NVIDIA、Dell 等企业正针对 SPEC ML 评测标准率先开展测试工作,国际最新 AI 算力评测标准的重大发布,将帮助用户更全面地了解 AI 算力系统的性能、扩展性及能效水平。

此外,SPEC ML 技术委员会举行换届选举,浪潮信息和英特尔连任技术委员会主席、副主席

近年来,随着人工智能产业快速兴起,也激发了 AI 算力的爆发式增长。过去 10 年,AI 计算的能力已经提高了不低于 100 万倍,但要满足像 ChatGPT 这类拥有巨量的参数和深度网络结构的大模型,算力性能提升还面临巨大的挑战。为了推动 AI 算力技术发展,更好评估不同芯片、算法、计算框架的 AI 算力性能表现,方便用户选择适合自己的计算解决方案,业界涌现出一批 AI 测评基准,比如 MLPerf、AIPerf、DeepBench 等。一般评测基准测试中,比如训练场景,会忽略需要大规模数据集的预训练过程,直接进行模型训练场景测试,而且仅会测试算力系统在 ResNet50、SSD、Transformer、Bert 等某个单一场景下的极限性能。但随着模型规模越来越大,从单节点到大规模集群,训练流程更加复杂,模态算法也更加丰富,需要更贴合用户真实训练场景的评测基准,系统评估算力系统面向多种 AI 工作负载的综合性能、集群扩展性、能效等多种关键参数。

过去一年,SPEC ML 技术委员会面向用户更复杂的训练流程、更丰富的 AI 负载,完成了国际最新 AI 算力评测标准 SPEC ML 的开发工作。SPEC ML 测试过程中,无论是训练场景还是推理场景,测试用例会模拟用户真实的应用环境,综合评估基于不同芯片、不同算法框架,服务器整机在 ResNet、Yolo、SSD、3D U-Net、MobileNet、BERT 等 10 多种 AI 工作负载下的综合性能,以及多节点集群扩展性能、能效、关键系统性能参数等,尤其是 Diffusion、Bloom 等负载的加入,实现了对诸如大模型等 AI 热点应用的性能评测,帮助用户更全面地了解 AI 算力系统的性能及能效水平。本次大会,SPEC ML 技术委员会展示了 ML 测试工具,测试基准的架构、各项功能及展现结果等,获得 SPEC 领导层及各成员的高度评价。

发布于: 刚刚阅读数: 5
用户头像

财见

关注

还未添加个人签名 2023-11-21 加入

还未添加个人简介

评论

发布
暂无评论
国际最新AI算力评测标准SPEC ML即将发布_财见_InfoQ写作社区