OpenAI投资的AI生物技术初创企业发布Chai-1,挑战AlphaFold3,引领药物发现领域的分子结构预测新标准

新型多模态基础模型Chai-1发布

近日,一家仅成立六个月的AI生物技术初创公司Chai Discovery发布了用于分子结构预测的新型多模态基础模型Chai-1,并附带了一份详细的技术报告。这份报告详细比较了Chai-1与其他模型如AlphaFold的性能。Chai-1能够统一预测蛋白质、小分子、DNA、RNA以及共价修饰等分子结构,在与药物发现相关的多种任务中达到了最新的技术水平。

Chai Discovery的联合创始人兼CEO Joshua Meier表示,Chai-1在多个基准测试中表现出色,成功率提升了10%到20%。他还提到,与AlphaFold相比,Chai-1在药物研发的关键任务上表现更佳。此外,用户可以通过Web界面免费使用Chai-1,该模型还可以应用于药物发现等商业用途。团队还公开了模型权重和推理代码,供非商业使用。

Chai-1模型的架构与特点

了解生物分子的三维结构对于研究其功能和相互作用至关重要,这是设计治疗分子的基础。近年来,使用深度学习方法预测蛋白质和核酸的折叠结构取得了显著进展。Chai-1是一种用于预测分子结构的多模态基础模型,可以完成与药物发现相关的各种任务。该模型采用了Abramson等人提出的架构,并加入了一些关键元素,如语言模型嵌入和约束特征等。

Chai-1可以直接从原始序列和化学输入预测生物聚合物结构,也可以通过实验约束进行提示,如表位图谱或交联质谱实验提供的约束,从而更准确地预测困难的结合复合物。研究人员在多个基准测试中评估了Chai-1的性能。例如,在PoseBusters基准集上,Chai-1的配体RMSD成功率达到了77%,与AlphaFold3相当。在CASP15蛋白质单体结构预测集上,Chai-1的Cα LDDT为0.849,优于ESM3-98B的0.801。

Chai-1的性能评估

研究人员在多个基准测试中评估了Chai-1的性能。在PoseBusters基准集上,Chai-1的配体RMSD成功率达到77%,与AlphaFold3相当。在CASP15蛋白质单体结构预测集上,Chai-1的Cα LDDT为0.849,优于ESM3-98B的0.801。在对接任务中,指定蛋白质的apo结构可将成功率提高到81%。

在低同源性评估集中,Chai-1在蛋白质多聚体预测方面优于AlphaFold Multimer 2.3(AF2.3),尤其在抗体-蛋白质界面预测中表现出色。在核酸结构预测方面,Chai-1的表现与RosettaFold2NA相似。此外,Chai-1还可以使用新数据(如实验约束)进行提示,从而显著提高性能。研究人员在技术报告中探讨了多种提示能力,例如使用少量接触或口袋残基(可能来自实验室实验)可以使抗体-抗原结构预测准确度翻倍,从而使得使用AI进行抗体工程变得更加可行。

未来愿景

Chai Discovery的核心团队由来自OpenAI、Meta FAIR和Google X等领先AI和生物技术组织的专家组成,致力于推动AI驱动的生物学研究。Chai-1的发布标志着他们在分子生物学领域的重大里程碑。然而,团队已经在考虑下一代AI基础模型。他们的最终目标是建立能够预测和重新编程生化分子之间相互作用的模型,这可能会改变科学家处理生物研究和工程的方式,从而加速新治疗方法的开发。

尽管Chai-1的发布是一项重大成就,但Chai Discovery团队认为这只是开始。在未来几个月里,他们计划继续改进Chai-1并开发新的模型,以进一步突破分子结构预测的极限。Chai-1有望彻底改变药物发现和生物工程领域。

公司背景

Chai Discovery是一家位于旧金山的AI医药开发初创公司,成立于六个月前。公司最近完成了种子轮融资,估值达到1.5亿美元。创始人Joshua Meier曾担任Absci Corp.的首席AI官,并在Meta和OpenAI担任过研究员。目前,Chai Discovery的团队规模不到10人,但已吸引了来自OpenAI、谷歌和Meta等科技巨头的优秀人才。公司免费提供首个AI模型,尚未讨论商业化计划。

本文来源: 机器之心【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...