东时间5月8日,谷歌DeepMind与 Isomorphic Labs(DeepMind 创始人创立)宣布推出新一代AI生物分子结构模型AlphaFlod 3。
据悉,新的模型不仅局限于蛋白质结构的预测,它还能够预测DNA、RNA、配体等生命分子的结构和相互作用,甚至可以预测翻译后修饰(PTM)和离子对相应分子系统结构的影响。研究人员仅需输入一个生物分子复合体的基本描述,几秒后便能收获该复合体3D结构的准确预测。
被《Nature 》收录的《Accurate structure prediction of biomolecular interactions with AlphaFlod 3》 对模型的能力进行了详细论证。
据论文数据显示:与现有的预测方法相比,AlphaFlod 3无需输入任何结构信息的情况下,其准确性已比PoseBusters基准上的最佳传统方法高出50%(一些特殊场景可达100%),理论上优于现有的基于物理的生物分子结构预测工具。
不过,任何工具的使用都不能脱离实际。经历数天测试,已有不少专家学者引入实际问题对AlphaFlod 3的能力评估。就目前测试结果而言,AlphaFlod 3确实充满潜力,但还不足以“颠覆”这一领域。
全生命分子预测,AlphaFlod 3更接近AIDD了
与过往的AlphaFlod系列工具类似,AlphaFlod 3也采取了神经网络架构,并以蛋白质数据库(PDB)中的全球分子结构数据为基础进行训练。不过,AlphaFlod 3的预测准度在大部分场景中都远超前代产品,且在预测范畴上实现了大规模的扩充。
这些能力的升级来源于AlphaFlod 3新引入的主要组件,包括升级版的Evoformer模块(现为Pairformer 模块)、全新的Diffusion Network等。其中,Diffusion Network从点云通过概率扩散预测坐标,进而实现了更高的预测精度。
此外,一些模型上的创新也对AlphaFlod 3的预测结果进行了优化。在手性分子等形态相似结构上,算法常会发生预测错误。这类情况下,AlphaFlod 3采用了交叉蒸馏的方式,让具备Transform模型的AlphaFlod 2先行预测,再把预测数据添加到 AlphaFlod 3 的训练中,一定程度提升了预测的准确率。
论文展示了部分AlphaFlod 3的预测结果。例如对感冒病毒刺突蛋白( 蓝色 )与抗体( 绿松石色 )和单糖( 黄色 )相互作用时的结构预测,与真实结构准确匹配( 灰色的)中,它与实验室得到的结果几近完全匹配(灰色部分)。