【深度学习驱动的抗体亲和力成熟:百奥几何与复旦团队利用GearBind及几何图神经网络技术实现蛋白质-蛋白质相互作用的精确模拟,成果荣登Nature子刊】

提高抗体与靶抗原之间的结合亲和力是抗体疗法开发中的关键任务。近日,复旦大学与百奥几何(BioGeometry)团队合作推出了一种名为 GearBind 的预训练几何图神经网络,展示了其在抗体亲和力成熟方面的潜力。通过多关系图构建、几何消息传递以及大规模未标记蛋白质数据的预训练,GearBind 在多个测试集上的表现优于现有方法。研究人员基于 GearBind 开发了一个强大的集成模型,成功增强了两种不同抗体的结合能力,实验数据显示设计的抗体突变体显著提升了性能。该研究以“Pretrainable geometric graph neural network for antibody affinity maturation”为题,发表在《Nature Communications》杂志上。

抗体在免疫系统中扮演着重要角色,并因其高亲和力的特异性结合能力而被广泛应用于诊断和治疗。然而,体外抗体亲和力成熟过程耗时且成本高昂,需要构建突变库并利用展示技术筛选,整个过程通常需要 2-3 个月或更长时间才能完成。此外,由于抗体互补决定区内的突变组合数量巨大,纯生物实验方法难以覆盖所有可能性。虽然分子动力学方法较为准确,但速度较慢,难以筛选大量突变。近年来,深度学习方法被引入以解决亲和力预测问题,但由于数据集规模有限,模型的准确性和可靠性仍面临挑战。

为了应对这些挑战,复旦大学和百奥几何的研究人员引入了 GearBind,这是一种利用多级几何信息传递来模拟细微的蛋白质-蛋白质相互作用的预训练深度神经网络。研究团队在大规模蛋白质结构数据集上使用对比预训练技术,将重要的结构见解纳入模型。研究人员进行了大量计算机实验来评估模型的性能。GearBind 的技术优势包括:

1. 图构建阶段:在界面上的所有重原子上构建多关系图。定义的关系涵盖了顺序邻近和空间邻近。将全原子图替换为仅主干原子图,或将多关系图替换为简单的 kNN 图都会导致严重的性能下降。
2. 特征提取阶段:采用多级消息传递方案来全面了解蛋白质界面上复杂的相互作用。
3. 预训练算法:提出了一种基于对比学习的预训练算法,利用 CATH 中丰富的未标记单链蛋白质结构,将侧链扭转角知识提取到模型中,进一步提升模型性能。

研究人员用两个实际案例验证了基于 GearBind 的管线。结果显示,在仅合成和测试 20 种候选抗体后,抗体 CR3022 与 Omicron SARS-CoV-2 变体刺突 (S) 蛋白的结合率就通过酶联免疫吸附试验 (ELISA) 测量增加了 17 倍,通过生物层干涉法 (BLI) 测量增加了 6.1 倍。所有设计的抗体均保持或增加了与 SARS-CoV-2 Delta 变体和 SARS-CoV 的受体结合域 (RBD) 的结合。在测试了 12 种候选抗体后,通过 ELISA 测量,全人单域抗体(UdAb)与癌胚抗原 5T4 的结合增加了高达 5.6 倍,通过 BLI 测量增加了高达 2.1 倍。

简而言之,GearBind 被证明是一种高效且强大的工具,可用于设计具有增强结合亲和力的抗体。研究人员通过分子动力学模拟观察到设计的突变体通过创建新的相互作用或加强现有的接触(尤其是氢键)来增强结合亲和力。这表明 GearBind 从数据中学习并设计出增加结合亲和力的突变体的能力。

尽管这项研究主要关注基于结构的方法,但对于其他团队已经探索的纯基于序列的亲和力成熟模型,研究人员也进行了评估。他们对 SKEMPI 上的 ESM-1b 和 ESM-1v 模型的评估得出了负的 SpearmanR 值,这表明大规模蛋白质语言模型的零样本预测并不是对蛋白质复合物的结合亲和力进行排序的普遍可靠方法。

展望未来,GearBind 的潜在应用不仅限于蛋白质-蛋白质结合优化。该模型可轻松适应解决蛋白质-肽和蛋白质-配体对接挑战,从而为其在微型结合剂和酶设计中的应用开辟了可能性。尽管 GearBind 方法前景乐观,但仍存在一些局限性。首先,准确的复合物结构是基于 ΔΔGbind 预测的前提,但这在抗体-抗原对中并不容易。可以通过同源建模或直接从序列预测复合物结构来应对。其次,依赖外部工具生成突变结构增加了时间成本,未来可发展端到端模型,并考虑氨基酸的插入和缺失。改进预训练策略和模型设计也将提高模型的泛化能力。

研究人员相信该工作朝着建立可靠、强大和高效的计算机亲和力成熟流程迈出了坚实的一步,这将为研究和药物发现应用带来巨大的机会。

本文来源: 机器之心【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...