中科院院士:借鉴美国超级计算机安腾 探索我国技术新路径
超级计算机作为尖端科技的核心载体与创新源泉,其发展水平已成为衡量一国科技硬实力、决定国际战略地位的关键指标之一。我国虽在超算领域取得显著成就,但在核心技术研发、应用场景构建等方面仍与发达国家存在一定差距。因此,我国需结合国情,探寻一条融合自主创新的中国特色超算发展道路,以提升在当下国际竞争格局下的科技竞争力。
我国超算发展道路怎么走? 是否有对标的、可借鉴的方向?
对此,中国科学院院士、北京航空航天大学教授钱德沛早前在接受媒体采访时曾谈到,“美国 D. E. Shaw 研究所就用专门设计的 ASIC 芯片搭建了分子动力学模拟专用计算机安腾(Anton),通过算法创新和软硬件协同,在分子动力学模拟中获得了比通用计算机高出百倍的计算能效,这是非常值得我们借鉴的。”
安腾超级计算机丨图片来源:网络
钱院士还谈到,“我们要真正把机器用好,提高高性能计算的应用水平,扩大应用领域。很多人也许觉得高性能计算离我们很远,可能只有少数领域能够用得上,但实际上,近几年随着高性能计算技术的快速发展,与传统行业不断地渗透和融合,高性能计算已经进入了一个全新的时代。因此,我认为要不断扩大应用领域。”
可见,钱院士认为,以超算安腾为例,做专用超级计算机并且应用到传统行业,是一条可行的发展道路。
超级计算机安腾是什么?其技术架构是怎样的?在分子动力学模拟中,它是如何做到比通用计算机高出百倍的计算能效的?
安腾超级计算机(Anton)是美国 D. E. Shaw 研究所(D. E. Shaw Research, DESRES)投入巨资打造的一款专为加快分子动力学模拟运算的专用超级计算机,于 2007 年首次发布。
安腾超级计算机丨图片来源:网络
为了显著提升分子动力学模拟的运算效率,在技术架构层面,安腾超级计算机采用了大量的专用集成电路(ASIC)作为其核心组件,并通过一个精心设计的高速三维环形网络将这些 ASIC 紧密互联。与通用超级计算机单一化的设计思路不同,超算安腾的架构专为细粒度事件驱动而设计运算,通过巧妙增强计算与通信过程的并行性和重叠性,显著提升了整体性能。此外,这种架构还赋予了系统广泛支持分子动力学相关算法高效运行的能力,为实现一系列基于软件的创新优化提供了坚实基础。
在硬件方面,安腾超级计算机(Anton)在芯片、主板及布线结构等硬件层面都进行了特色设计。例如,其通过特殊设计的专用芯片,以最大限度地减少数据传输与计算过程中的耗时,巧妙地按任务性质与精度划分区域进行计算,攻克了长期以来阻碍模拟速度提升的原子间相互作用力的计算难题。在软件方面,D. E. Shaw 研究所为安腾超级计算机研发了与硬件配套的分子动力学模拟软件 Desmond,以确保硬件效能得到充分释放。
得益于软硬件的协同创新,安腾超级计算机在处理分子动力学问题时展现出惊人的计算效率,其性能较传统超算提升 100 至 10000 倍,甚至超越当前全球最强超算 Frontier 达 50 倍以上。安腾超级计算机对分子动力学模拟产生了颠覆性影响:它将模拟时间尺度从微秒大幅提升至毫秒级别,成功模拟了众多此前遥不可及的生物物理现象,如蛋白质折叠过程、抗体亲和力成熟过程中的构象变化等。这一卓越表现使超算安腾两度荣膺高性能计算领域的“诺贝尔奖”——Gordon Bell 奖。
分子动力学模拟丨图片来源:网络
超级计算机安腾是如何应用到传统行业的?
通过设计与集成专用的 ASIC 芯片,以及专为生物计算优化的架构与软件系统,安腾超级计算机使得大规模、高精度的分子动力学模拟得以实现,这使得它在生命科学研究与药物研发领域发挥出世界范围内独一无二的性能能力。这一能力不仅拓展了对蛋白质世界的认识,还为疾病机制解析、药物靶点发现及药物设计提供了强大的计算支持,从而加速科研进程,提高药物创新成功率。
例如,鉴于 3CL 蛋白酶在病毒增殖与组装过程中扮演了核心角色,并且是新冠药物开发的热门靶点之一,2020 年 3 月 27 日,D. E. Shaw 研究所公开了一项关于新冠病毒 3CL 蛋白酶的重要研究成果——完成了对该蛋白酶长达 100 微秒的分子动力学(MD)模拟动画及数据发布,这一突破性模拟为科研人员揭示新冠病毒生命周期的内在机制以及设计针对性的 3CL 蛋白酶抑制剂提供了极其宝贵的理论依据。通常情况下,如果利用当今全球顶尖的超级计算机集群,完成同等规模的模拟仍需耗时数年之久;然而,得益于超算安腾针对分子动力学算法的软硬件优化,该任务仅在短短十数日内便高效完成。此后两年内,D. E. Shaw 研究所持续发力,进一步发布了累计超过 1000 微秒的新冠病毒 MD 模拟成果,这些成果对新冠病毒的病理研究及推动相关药物研发产生了深远影响。
还例如,美国 AI 制药企业 Relay Therapeutics 在超算安腾强大计算能力的支持下,仅耗时 1 年半、投入 1 亿美元,就成功确定了高选择性 FGFR2 抑制剂 RLY-4008 的分子结构。目前,该药物正顺利推进至美国 FDA 临床二期阶段,极有可能跻身史上从研发到上市速度最快的创新药物之列。Relay 在 RLY-4008 项目及若干其他管线中所展现的显著临床前研发效率,一举打破了业界长期存在的“双十定律”,即一款创新药的研发历程普遍需历经十年以上并耗费逾十亿美元。
从安腾超级计算机的成功实践中,我们可以看到一种全新的超算技术发展模式:即聚焦特定领域进行深度定制化设计,并积极融入行业生态,确保尖端技术能够应用于实际应用场景,从而发挥其最大价值。
另一方面,我们必须清醒认识到,中国超算研究机构已于 2015 年 2 月首次被美国列入实体清单,面临严格的技术封锁。目前,全球仅有的安腾超级计算机设备分别部署于美国匹兹堡超算中心及纽约市的 D. E. Shaw 研究所内。这些稀缺资源的使用权限严格受限,仅根据提交给美国国家科学院独立专家委员会的科研提案进行分配,并明确规定仅对美国学术机构开放,明确禁止包括中国在内的其他国家进行使用。
我们需要加紧对中国超算发展之路的探索与实践,尤其是在面对国际技术封锁的严峻形势下,如何借鉴安腾超级计算机的成功经验,构建具有中国特色的超算生态系统,显得尤为重要。这不仅要求我们在硬件设计上敢于创新,针对特定领域需求研发专用芯片与架构,实现高效能计算;更要在软件生态与行业应用层面下功夫,鼓励跨学科合作,推动定制化软件开发,确保超算技术与各行业实际需求紧密结合,真正赋能经济社会发展。同时,加强自主可控技术的研发与人才培养,构建安全可靠的超算产业链,以应对国际环境变化带来的挑战,确保我国超算事业在国际竞争中保持领先地位。
评论