3D 科学计算理念驱动下的超级计算机,加速新材料研发
材料是科技和产业革命的先导,如同硅之于信息时代、功能陶瓷之于手机、钢筋混泥土之于高楼大厦,可以说,人类史实际上就是一部材料发现史。
所谓“一代材料,一代技术,一代产业”,材料制造是产业链中的关键一环,其上游涉及各类原材料,下游则涵盖建材、光伏、医疗器械、航空航天、新能源汽车、消费电子、半导体等多个应用领域。这些领域市场需求的持续上涨,吸引着投资人们对材料项目的青睐,也推动着产业界对新材料研发的加大投入。
前景固然广阔,但材料研发之艰难也是行业公认的。
新材料研发的技术壁垒高,人力物力的投入成本高,研发周期也非常长。作个比较,了解医药领域的人应该知道“双十定律”,即一种新药的研发基本上需要耗时十年、耗资十亿美元,而对于新材料研发而言,成本要再高 50%以上,成功率也更低。要跑完“开发阶段-实验工厂阶段(小试)一示范生产线(中试)—示范工厂一工厂量产”所有环节,耗时可高达 20 年。
为了打破材料研发效率低、成本高的瓶颈,产学界做了长久的探索。
早期,材料研发过程缓慢而艰苦,如爱迪生试验灯丝一般,实验人员采用简单循环试错的方式去发现材料,然后对所获材料做结构属性分析和电化学性能测试。这种方式严重依赖经验积累,科学性较差,且存在偶然性,耗时耗力不说,还不一定能获取最优目标。
20 世纪计算化学的兴起,为“手工作坊”模式的材料研发打开了现代计算的大门。科学家建立理论模型,从材料最基本的电子结构出发做第一性原理计算,运用密度泛函理论、采用高通量的实验方法等手段来辅助筛选、设计和分析新材料,一定程度上节约了试错成本。但对于复杂真实材料的开发,仍缺少合适的算法。
近年来,计算模拟仿真的方法越来越开始广泛地被使用,利用计算机模型和虚拟环境,在较短时间内完成特定体系的原子尺度的模拟计算,在结构设计、制备工艺、性能测试和状态评估等环节都能提供有益指导。比如要研究一种新材料的导电性能,建立数学模型和物理方程后,通过对材料的电子结构和运动方式进行模拟计算,就能在实际合成材料前就预测其导电性能,从而优化材料设计。
遗憾的是,计算仿真也仍然有其局限性:首先是计算速度仍较慢,通过计算模拟来完成新材料的筛选、性能预测和优化设计,仍要做大量的实验,研发周期较长。因为从计算架构角度看,传统的计算仿真主要采用二维计算系统架构,即服务器之间两两通过交换机或路由器线性相连,因此在处理三维空间的计算问题时,会产生大量额外的通信工作量,计算的复杂程度也会成倍增加。
其次,计算的规模较小、精度较低。仿真技术基于计算机模型,与真实环境本就存在一定误差,难以准确地捕捉高维对象的运动过程,所以它对材料分子和原子的模拟精度是不够的,无法在最大程度上还原研究对象在特定情境下的性质。
市场需求往往催生技术创新,下游市场对产品需求的增长,正推动许多材料制造企业尝试突破计算模拟仿真技术的上述瓶颈,以抢占行业风口。
一个更强大的技术路线,就是利用超级计算机来进行新材料研发。
这里有两个实力玩家非常值得介绍,一个是日本的住友橡胶工业有限公司(SRI),在 2014 年就运用超算取得了轮胎材料的技术突破。
住友橡胶提出了“4D NANO DESIGN”技术,利用当时世界第一超算“京”(K Computer),在纳米级尺度上高精度模拟了橡胶分子结构和运动形态,从而优化了轮胎性能,包括湿地抓地力、耐磨性和燃油效率等。
比如橡胶发热问题,与填充物二氧化硅的网络行为、交联结构和二氧化硅界面聚合物行为都密切相关,如果橡胶材料在加工过程中出现不完全交联,内部分子链运动就会受限制,能量聚集产生内应力,进而导致轮胎发热。而二氧化硅可以吸收硅橡胶中游离的硅烷,增强硅烷之间的交联,使得硅橡胶分子更稳定,轮胎耐温性能也就更好。研究人员正是基于对此化学过程的模拟计算,成功提升了轮胎的耐磨、耐热性能。
这项黑科技的进阶版“ADVANCED 4D NANO DESIGN”,后续还在欧洲“2017 年轮胎技术博览会”上荣获了“年度轮胎技术”奖。
ADVANCED 4D NANO DESIGN 技术中尖端研究设备的协同运用
另外,专做汽车轮胎的住友子公司 Falken,也在借助 2020 年曾问鼎全球超算 TOP500 榜首的富岳超算(Falken),持续推进橡胶材料模拟的技术研发,成为富岳的首批工业领域用户。值得一提的是,富岳的产业应用场景还在不断扩大,比如田边三菱制药使用富岳分析药品的晶体结构、日本汽车零部件制造商电装借助富岳研究汽车内预防传染病的空气流动特征等等。
另一个不得不提的是材料化学制造业巨头巴斯夫。2017 年,巴斯夫首次启动其超级计算机“Quriosity”,它的计算速度为 1.75petaflop,在各个业务线都得到了充分利用,平均每天执行 20,000 个任务,全球 400 多名员工都在使用,已经成为全球化工行业最强大的计算机。凭借这台超算,研究人员能够建立更复杂的模型,允许更多参数的变化,更精准地预测材料性能。
Quriosity 拥有超过 1000 个计算节点和 3000 兆字节的存储容量,图为其中一个计算节点特写
得益于超算的支持,巴斯夫首次对中间产品环氧乙烷生产中使用的催化剂数据进行了系统研究,发现了催化剂的配方和应用特性之间存在相关性,从而更精确、更快速地获取到了催化剂的性能和寿命预测。在农作物保护产品的开发中,也利用超算进行分子建模,迅速确定了有效且对环境无害的化合物。
巴斯夫的研发人员如今已经将基于超算的计算模拟作为重要的技术手段,而很少再待在实验室里,比如巴斯夫的一位量子化学专家安东尼·德贝利斯(Anthony Debellis),平日工作就是在超级计算机上做分子模拟,从数千种模拟结果中筛选出几种最优材料。目前,他已经在 Quriosity 上运用量子化学模拟计算成功支持了一个紫外线吸收剂的研发项目,推动了该吸收剂在汽车涂料、防晒霜和个人护理产品等方面的应用。
当超算提供的强大算力的同时,计算架构理念也在不断升级,推动材料研发效率的再提升。一种新兴的 3D 科学计算范式,在解决计算效率难题方面已经显示出了极大潜力。
3D 科学计算,顾名思义是一种能够模拟真实世界中三维对象的计算方式,即在计算机上建立原子的三维空间坐标,并用复杂的物理公式计算特定时间下原子坐标的位置变化,再加上超算的辅助,就能比传统科学计算算得更快、更准。具体到材料计算场景,运用 3D 科学计算可以从原子和电子级别模拟材料的结构、性质和动态演化过程,从而帮助预测新材料的多种性能,筛选和设计新材料。
之所以能够实现三维计算模拟,计算架构上的改变是必然的,这当中最核心的就是通信方式的变化:在空间维度上布局服务器,缩短其物理距离和数据传输路径,有效降低了通信延迟;而且,流量是分散在多层级网络上的,单点的数据传输压力得到缓解,数据传输的流畅性大大提升。
这本质上是由于计算机可以同时处理多个并行的模拟计算任务,类似的原理在人工智能计算领域也得到了运用,例如,英伟达提出的加速计算(Accelerated Computing)概念,就是在具有超多核心的 GPU 上做大规模的并行计算,加速大模型的训练和推理。
而在生物计算领域,也有一个案例堪称应用 3D 科学计算理念的典范——安腾超级计算机(Anton)。
安腾由美国 D. E. Shaw 研究所打造,2007 年首次发布,专门用于模拟生物分子运动和相互作用,它的出现颠覆了过去人们对生物计算的认知,为药物发现、疾病治疗等研究领域做出了极大的贡献。
我们知道,蛋白质的一次折叠就包含海量的动态信息,如果用静态影像去获取这些信息,至少需要十亿张“照片”,而安腾作为一台“计算机显微镜”,能够在短时间内模拟大体系规模的生物大分子运动。对于一个 100 万原子级的蛋白质在 0.001 秒内的运动的模拟,安腾只需要短短 10 天即可完成计算,它的计算效率比全球最强的通用超算 Frontier 都要快 50 倍!
安腾的计算速度能够如此惊人,是由其软硬件系统架构决定的,尤其是它的芯片分布结构。安腾采用的是 ASIC 专用芯片,芯片之间通过一个高速三维环形网络互联起来,形成一个环面拓扑结构,整个服务器被紧密排放一个正方体机箱当中。
安腾 ASIC 芯片通过高速通道连接形成三维环形拓扑结构
在这种排布下,机箱中的每个计算节点与周围最近的 8 个节点以及其他 2 的倍数距离的节点建立连接,任意两个节点间的通信通过最多不超过𝑂(log𝑑)步跳转,那么在进行大规模并行计算时,节点之间的通信复杂度就低得多,也就能加快分子动力学模拟这种通讯密集型计算的速度。
事实证明,基于 3D 科学计算理念的安腾超算在产业应用上大获成功,掀起了新药研发行业的革命。美国明星制药公司 Relay 凭借发现一款胆管癌治疗药物 RLY-4008 的结构,在全球制药界横空出世、一战成名,背后借助的就是安腾。该药物结构的确认仅仅用了 18 个月,成本不到 1 亿美元,颠覆了制药行业的“双十定律”。
如今,3D 科学计算的理念已经逐渐深入应用到各个科学计算场景,在复杂系统模拟、高维数据处理以及大规模并行计算等问题上提供了更好更快的解法。而说回到材料研发行业,技术的迭代速度很大程度上决定了新材料的研发速度和市场红利的周期,我们期待产学界能更多地利用基于 3D 科学计算架构的超级计算机,以更快的计算速度,获取更多前沿新材料研发成果,在产业应用中占据先发优势。
评论