写点什么

鲲鹏 DevKit 助力南京信息工程大学高效开发

作者:说山水
  • 2023-06-02
    湖北
  • 本文字数:2634 字

    阅读完需:约 9 分钟

全球变暖背景下,干旱、高温、暴雨等极端天气带来的自然灾害频发,如 2022 年夏季我国南方地区历史性高温干旱事件,23 个省份持续出现 40℃以上高温,据麦肯锡预测,预计到 2050 年,由于极端高温和湿度增加而带来的劳动力损失,将使亚太地区每年损失 4.7 万亿美元的 GDP,约占全球损失总额的三分之二。因此如何更精确地提前预测气候并采取及时有效的防范措施,是减少此类自然灾害的关键手段。

气象灾害教育部重点实验室作为南京信息工程大学的重点实验室之一,其团队自主研发的极端高温干旱天气模拟与预测平台,采用自主创新开源操作系统及自主创新的组件部署,配合网页端展示平台可实时展示多种气象要素。同时也可用于区域气候、空气质量模拟等大气数值模拟实验等,可实现对过往极端天气事件的高精度模拟以及未来可能出现的极端事件的预报。



气象应用是高性能计算的重要领域,算力是影响天气预警精确性的重要因素。为更加高效的完成气象预测和科研工作,实验室对于承载极端高温干旱天气模拟与预测平台的底层基础设施算力有着强烈的诉求:

海量数据高效处理

气象预测涉及跨时间和地区的海量数据收集及处理,以长江中游地区的一次高温灾害事件的模拟为例,涉及的高精度资料约 10G。随着各类气象观测数据的预测精度及频率的递增,每年的气象数据已达到 PB 量级,计算需求量大。

高精度、高性能

随着气象预测的准确度越来越高,气象行业对精度及天气短临预报的时效性要求也越来越高:预报精度从几百公里、几十公里到实现“点对点”的预报,预报时效性由超前一周提升至超前半个月、一个月的精准预测……这些都对算力提出了更高的要求。

鲲鹏平台天生的众核高并发、高吞吐能力,能够更好的满足上诉需求,同时提供鲲鹏开发套件 DevKit,实现应用的高效开发和性能优化。基于以上考虑,南京信息工程大学的技术团队选择鲲鹏作为「极端高温干旱天气模拟与预测平台」的算力支撑,并在鲲鹏上原生开发部分侧边界试验模块。



【极端高温干旱天气模拟与预测平台架构图】

迁移:基于鲲鹏 DevKit 2 人天快速迁移极端高温干旱天气模拟与预测创新平台

在项目实施初期,开发人员需要将极端高温干旱天气模拟与预测创新平台快速迁移到鲲鹏。由于整个系统架构复杂,涉及修改代码行数 1806 行,源文件数 293 个,手动迁移预计需要 15 人天才能完成。

开发人员通过鲲鹏 DevKit 代码迁移工具对依赖文件自动识别、兼容 JAR 包一键下载、代码修改建议一键替换,整个迁移过程缩短至 2 人天,大大降低了开发过程中的人力资源成本。



【使用鲲鹏 DevKit 代码迁移工具扫描获取迁移报告】

开发 &调优:基于鲲鹏 DevKit 高效开发部分侧边界试验模块,性能提升 57.7%

迁移完成之后,为应对极端高温干旱灾害的科学研究等场景需求,开发团队需要在鲲鹏平台上新开发部分侧边界试验模块,该模块作为平台的核心组件,用于研究季节内振荡等大气低频变化对于极端事件的影响。

由于原有 X86 平台的开发经验和兼容生态并不能直接复制到鲲鹏平台之上,开发人员在应用开发过程中也遇到了多重挑战:

在开发过程中缺乏鲲鹏优势能力的实时引导,无法充分发挥鲲鹏的算力;★ 不熟悉鲲鹏兼容生态,无法快速搭建高性能计算应用编译环境,开发效率低;

面对上述挑战,技术人员在开发过程中使用了鲲鹏 DevKit 提供的鲲鹏开发框架、高性能计算 SDK、GCC for openEuler 和性能分析工具,进一步提升应用开发效率及软件运行性能。

首先,技术人员通过鲲鹏开发框架插件快速创建高性能计算场景化工程, 该工具支持启发式编程,能够智能提示近万条函数和编译选项,大大提升了开发体验,使得开发者可以专心攻克业务逻辑设计;

同时基于鲲鹏高性能计算 SDK 一键引入 Hyper MPI 通信库和鲲鹏数学加速库,有效提升了网络加速能力,使能了节点间高速通信网络和节点内共享内存机制,以及优化的集合通信算法,更便捷高效地完成了部分侧边界试验模块的应用开发。

为了提升编译效率,技术人员在编译过程中将之前的 GNU-GCC 更换为 GCC for openEuler。GCC for openEuler 提供了针对鲲鹏微架构处理器及指令优化,通过软硬协同相较 GNU-GCC 提供更强的性能。提升了 WRF 组件在鲲鹏架构上的编译效率,增强了组件间的耦合关系,从而使组件的性能得到了很大的提升。

此外,由于试验包括控制试验以及敏感性试验两部分,计算量较一般数值模拟大幅增加,所以对性能要求极高。

因此技术人员采用鲲鹏 DevKit 高性能计算场景化分析对平台进行了深度优化:通过鲲鹏 DevKit 高性能计算场景化分析创建 MPI 分析任务,在进行积分操作时发现存在积分响应时间长等问题,根据工具的提示,技术人员快速找到了异常函数,并对异常函数展开了深入分析和优化,通过上述一系列的分析与调优,在同等算力下,初始场处理时间由 0.85s 降低至 0.55s;边界场处理时间由 0.10s 降低至 0.07s;积分一步响应时间由 0.33s 降低至 0.19s;结果输出的时间由 2.01s 降低至 0.85s,最终极端高温干旱天气模拟与预测创新平台在鲲鹏平台上的运行性能整体提升了 57%。



【使用鲲鹏 DevKit 开发工具优化前后性能对比图】

上述性能的提升极大的增强了平台数值天气模拟计算能力,提升了数值气象预报计算效率,优化了极端天气模拟预报速度,大幅降低了计算成本;也为广大公众、各行各业提供更加精细化、专业化、多元化的服务,服务防灾减灾、乡村振兴、生态文明建设,保障生命安全、生产发展,助力经济社会高质量发展。

南京信息工程大学作为国内气象学科的佼佼者,在气象数值模拟、气象预报领域建树丰富,本次基于鲲鹏平台开发的「极端高温干旱天气模拟与预测平台」方案也在鲲鹏应用创新大赛 2022 全国总决赛中获得铜奖,江苏赛区二等奖。

未来,南京信息工程大学也将持续致力于气象科学的发展,逐步提升气象预测平台对干旱天气预测的准确度和实时性,未来可结合各气象部门及各大学、研究所等,孵化出更多的智慧气象应用,进一步降低高温干旱复合灾害在世界各地对农业生产、国民经济造成的影响。

作为鲲鹏计算产业生态重要伙伴,南京信息工程大学已与江苏鲲鹏·昇腾生态创新中心建立长期合作关系。未来,鲲鹏将持续通过最新的技术使能伙伴联合创新,打造更具竞争力及创新力的行业解决方案,促进千行百业数字化转型。

南京信息工程大学作为国家“双一流”建设高校,高度重视科技创新引领,承担国家自然科学基金项目、国家重点研发计划重点专项(含课题专项)百余项。“气象灾害教育部重点实验室”作为国家级重点学科培育点之一,重点围绕气象灾害的监测、预警及影响评估等方向开展应用基础研究,以提高天气气候预报预测准确率和气候变化影响评估水平,为国家防灾减灾和应对气候变化提供科学支撑。

用户头像

说山水

关注

还未添加个人签名 2023-05-29 加入

还未添加个人简介

评论

发布
暂无评论
鲲鹏DevKit助力南京信息工程大学高效开发_说山水_InfoQ写作社区