就在刚刚,新一代 AlphaFold——由 Google DeepMind 和 Isomorphic Labs 研究团队推出的革命性人工智能(AI)模型 AlphaFold 3——登上了权威科学期刊 Nature。
据介绍,AlphaFold 3 以前所未有的精确度成功预测了所有生命分子(蛋白质、DNA、RNA、配体等)的结构和相互作用。
与现有的预测方法相比,AlphaFold 3 发现蛋白质与其他分子类型的相互作用至少提高了 50%,对于一些重要的相互作用类别,预测准确率甚至提高了一倍。
研究团队认为,AlphaFold 3 将有助于改变我们对生物世界和药物发现的理解,进而开启人工智能细胞生物学的新时代。
为了利用 AlphaFold 3 在药物设计方面的潜力,Isomorphic Labs 已经与制药公司合作,将其应用于现实世界的挑战,并最终为一些对人类造成最具破坏性影响的疾病开发出新的疗法。
相关研究论文以“Accurate structure prediction of biomolecular interactions with AlphaFold 3”为题,已发表在 Nature 上。
此外,Google DeepMind 也基于 AlphaFold 3 推出了一个免费平台——AlphaFold Server,供全世界的科学家利用它进行非商业性研究,预测蛋白质如何与细胞中的其他分子相互作用。
只需点击几下,生物学家就可以利用 AlphaFold 3 为由蛋白质、DNA、RNA 以及选择的配体、离子和化学修饰组成的结构进行建模。
对此,Francis Crick 研究所 Uhlmann 实验室的研究科学家 Céline Bouchoux 评价道:
“AlphaFold 3 一经发布,有可能像 AlphaFold 一样具有开创性。有了 AlphaFold Server,其不再仅仅是预测结构,而是慷慨地提供访问权限:允许研究人员提出大胆的问题,并加速发现。”
AlphaFold 3 是如何炼成的?
每个植物、动物和人类细胞内都有数十亿台“分子机器”。它们由蛋白质、DNA 和其他分子组成,但没有任何单独的部分可以独立工作。只有看到它们如何在数百万种组合中相互作用,人类才能开始真正了解生命的进程。
近年来,基于人工智能技术的 AlphaFold 系列模型在这方面取得的成就,给人类带来了足够的震撼和新的认知。
AlphaFold 首次于 2020 年问世,其和迭代版 AlphaFold 2 能够根据蛋白质的氨基酸(蛋白质的基本成分)序列预测其 3D 结构,如今全球已有数百万研究人员将 AlphaFold 2 应用在疟疾疫苗、癌症治疗和酶设计等领域,有了不少新的发现;之后的 AlphaFold-Multimer 则推动了对蛋白质-蛋白质复合物的预测。
然而,由于不同类型的特异性相互作用差异太大,扩大单一深度学习模型可以预测的复合物范围一直是一个未解决的难题。
在这项工作中,研究团队认为,AlphaFold 3 可以将我们从蛋白质带入广泛的生物分子领域。这一飞跃有望开启更具变革性的科学——从开发生物可再生材料和更具抗逆性的作物,到加速药物设计和基因组学研究。
据论文描述,只需给定一个分子输入列表,AlphaFold 3 就能生成它们的联合 3D 结构,揭示它们是如何组合在一起的。
AlphaFold 3 可以对蛋白质、DNA 和 RNA 等大型生物分子进行建模,当然也包括小分子,比如配体,许多药物的作用机制是通过作为配体与特定蛋白质或其他生物分子结合来实现的。
图|在土生真菌中发现的酶(来源:Google DeepMind)
此外,AlphaFold 3 还可以模拟这些分子的化学修饰(控制着细胞的健康功能),这些细胞一旦受到破坏就会导致疾病。
AlphaFold 3 的强大能力,来自于其新一代的架构和训练(已经涵盖了所有生命分子)。其核心是改进版本的 Evoformer 模块,这是一种深度学习架构,是 AlphaFold 2 取得成功的基础。在处理输入后,AlphaFold 3 使用扩散网络(类似于人工智能图像生成器中的扩散网络)进行预测。扩散过程从原子云开始,经过多个步骤,最终形成最精确的分子结构。
研究团队表示,AlphaFold 3 对分子相互作用的预测准确性超过了所有现有系统。作为一个以整体方式计算整个分子复合物的单一模型,它具有统一科学见解的独特能力。
引领药物发现
AlphaFold 3 具备了药物设计的能力,可以预测药物中常用的分子(如配体和抗体),这些分子可与蛋白质结合,改变蛋白质在人类健康和疾病中的相互作用方式。
AlphaFold 3 在预测类似药物相互作用(包括蛋白质与配体的结合以及抗体与靶蛋白的结合)方面达到了前所未有的准确性。
在无需输入任何结构信息的情况下,AlphaFold 3 在 PoseBusters 基准测试中的准确率,比最好的传统方法高出 50%,是首个超越基于物理的生物分子结构预测工具的人工智能系统。
预测抗体与蛋白质结合的能力,对于了解人体免疫反应的各个方面以及设计新的抗体至关重要,这是一种不断增长的治疗方法。
据了解,Isomorphic Labs 将 AlphaFold 3 与一套补充的内部人工智能模型结合,正在为内部项目以及制药合作伙伴进行药物设计;他们正在利用 AlphaFold 3 加快并提高药物设计的成功率——通过确定新的疾病靶点,并开发新的方法来触及以前无法实现的现有靶点。
不足与展望
AlphaFold 3 的问世,使生物世界变得更加清晰。
它让科学家能够看到细胞系统的所有复杂性,包括结构、相互作用和修饰等。这个观察生命分子的新窗口揭示了它们之间的联系,有助于了解这些联系如何影响生物功能,如药物的作用、激素的分泌和 DNA 修复的健康保护过程等。
研究团队表示,AlphaFold 3 的潜力已经显现,他们迫不及待地想知道未来会发生什么。
然而,正如他们在论文中写道的,AlphaFold 3 模型依然存在一些局限性,需要进一步的研究和改进。例如:
立体化学限制:模型输出的立体化学有时会违反手性规则,尽管输入是正确手性的参考结构。另外,模型偶尔会产生重叠的原子。
幻觉影响:从非生成性的 AlphaFold2 模型转换到基于扩散的 AlphaFold3 模型,引入了在无序区域中产生虚假结构秩序(幻觉)的挑战。虽然幻觉区域通常被标记为低置信度,但它们可能缺乏 AlphaFold2 在无序区域中产生的典型丝带状外观。
预测准确性问题:对于某些目标,准确预测仍然具有挑战性。为获得最高精度,可能需要生成大量预测并对其进行排名,这增加了计算成本。特别是对于抗体-抗原复合物,预测质量随着模型种子的数量增加而显著提高。
结构构象限制:模型预测的结构构象可能不正确或不够全面,这取决于指定的配体和其他输入。例如,E3 泛素连接酶在无配体时呈现开放构象,但模型预测的构象只有闭合状态。
缺乏动态信息:模型主要预测生物分子系统的静态结构,而不是在溶液中的动态行为。
特定目标预测限制:对于某些特定类型的生物分子复合物,模型的预测可能存在局限性。
尽管在所有相互作用类型中实现高度准确的预测,仍然存在一些实质性挑战,但 AlphaFold 3 证明,可以构建一个深度学习系统,对所有这些相互作用显示出强大的覆盖和泛化能力。
未来,实验结构测定方法的进步,如冷冻电镜和断层扫描技术的显著改进,将提供大量新训练数据,进一步改善这类模型的泛化能力。
而且,随着深度学习技术的不断发展,以及实验结构测定方法论的不断革新,结构建模将继续进步,推动我们进入一个结构信息驱动的生物理解和治疗开发的时代。