百度 HelixFold 3 重磅升级 打造生命科学领域“超强引擎”
当下,AI for Science 已成为全球人工智能发展的新前沿。从精准解析蛋白质结构、引发学界与业界轰动的 AlphaFold,到实现高精度分子模拟、为科研探索开辟新径的深度势能方法,AI 作为科技创新的关键引擎,正以前所未有的深度与广度渗透到生命科学领域。
1 月 15 日,百度智能云举办千帆思享会——生命科学专场。会上,重磅升级发布了由百度螺旋桨 PaddleHelix 团队与百度智能云「云高性能计算平台 CHPC」团队联合打造的生物计算大模型工具 HelixFold 3。升级后的 HelixFold 3 将在 RNA 结构预测、共价修饰、抗原抗体等复杂场景中实现更高准确性,为研发工作带来更为精确、高效、便捷的解决方案。
对标谷歌,助力国产生科研发加速
长久以来,如何实现从氨基酸序列到蛋白质三维结构的准确预测,对于生物学研究和药物开发有着重要意义。过去 4 年间,谷歌 DeepMind 研发的 AlphaFold 系列在蛋白质结构预测领域始终保持领先地位,2024 年 5 月推出的 AlphaFold 3 模型,更是突破了传统研发模式成本高、耗时长、蛋白质结构解析困难等局限,能以高精度预测蛋白质数据库内几乎所有分子类型的复合物结构,大幅加速了生命科学研究的步伐。
然而,AlphaFold 3 当时尚未开源,用户的每日调用次数也有限,这让新技术也尚未在产业界得以广泛应用和发展。在此背景下,2024 年 8 月,百度螺旋桨团队依托百度智能云 CHPC 平台的强大算力以及在生命科学领域的研发积累,正式发布了面向生命科学领域的大模型——HelixFold 3,成为全球首个对标谷歌 AlphaFold 3 的模型。
凭借卓越的技术架构和系统能力,HelixFold 3 在常规生物分子结构预测任务中达到与 AlphaFold3 精度媲美的水准。此外,HelixFold 3 依托于百度智能云 CHPC 平台,为用户提供了高性能计算的线上服务。基于 CHPC 平台强大的计算资源支撑和高效的资源调度能力,HelixFold 3 在高通量生物信息学应用处理方面展现出卓越的性能,同时实现了推理成本的显著降低,使得科研人员能够以更低的成本进行大规模结构预测,提升生物医药研发效率。
精度飙升,为科研一键开启“便捷模式”
此次升级后,HelixFold 3 将在 RNA 结构预测、共价修饰、抗原抗体等更多复杂场景上展现更高准确性,同时对外开放了 API 接口,并探索了更多场景的应用。例如,多项专业评测结果显示,HelixFold 3 在 RNA 分子预测以及多个涉及共价修饰的结构预测方面,实现了精准度的大幅提升,其表现持平与 AlphaFold 3 相当,甚至在部分场景下超越后者。
在抗原-抗体的结构预测方面,HelixFold 3 同样表现出色,在最新的 71 例 PDB 抗原抗体结构预测的数据上精度已能媲美 AlphaFold3 Server,预测精度获得进一步提升,成功率提升至 80%以上,为深入研究抗体的结合机制及分析提供出相应解决方案提供了强有力的支持。
亮点功能加持,更多应用场景探索
HelixFold 3 基于百度智能云 CHPC 强大的计算能力,通过 webserver 和 APISDK 调用等多种模式,为用户提供即开即用,高效便捷的生科工具。
在功能层面,HelixFold 3 支持任意配体的输入,这一能力相比 AlphaFold 3 仅支持固定的 20 种配体,大幅拓宽了药物研发场景的应用范围。侧链修饰作为药物研发中的常用策略,能够显著优化分子特性并提高相互作用的精确度。HelixFold 3 通过 SMILES 描述侧链修饰,进一步扩展了其对化学空间的覆盖范围。目前,HelixFold 3 已覆盖 PDB 数据库中超过 50% 的修饰场景,而 AlphaFold 3 的覆盖范围不足 5%。
HelixFold 3 在相互作用约束方面,支持为任意类型的生物分子设置距离约束。该功能可用于指定口袋位置,指定抗原表位,指定结合位点,结合姿态等场景,可通过指定距离的大小控制约束的强弱。该能力也是当前 HelixFold 3 所独有的。
通过距离约束,HelixFold3 在抗原-抗体,蛋白-蛋白,蛋白-小分子场景提升显著,同时,HelixFold 3 还支持 API SDK 的调用,用户无需购置昂贵的 GPU 计算资源,无需配置复杂的运行环境,即可集成 HelixFold 3 的 APISDK 服务到工作流中,提升科研效率。
值得注意的是,得益于强大的预测任意分子间相互作用的能力,HelixFold 3 还可以高效率的进行分子的筛选,为大分子和小分子药物发现提供技术支持。
基于 HelixFold3 的大通量小蛋白设计系统
长期以来,百度智能云深耕于 AI 大模型与生命科学交叉领域,持续聚焦大模型技术在生物计算领域的深度融合与创新应用。依托先进的螺旋桨算法,百度智能云已与多家药企携手合作,在药物研发管线推进过程中发挥重要作用,助力药企突破技术瓶颈,加快研发进程。
值得一提的是,早前由百度研发的 mRNA 序列优化算法 LinearDesign 曾成功登顶《Nature》杂志,这也是中国科技企业首次以第一完成单位的身份登顶世界顶级期刊,彰显了其在技术能力与科研实力方面的雄厚底蕴,在全球科研领域获得高度认可。
评论