探索黄病毒起源:AlphaFold与人工智能揭示蛋白质结构中的进化联系

人工智能(AI)正在助力重新绘制病毒家族树。借助 AlphaFold 预测的蛋白质结构以及受聊天机器人启发的“蛋白质语言模型”,研究人员发现了病毒家族中一些惊人的联系,包括感染人类的病原体以及新兴的威胁。

长期以来,科学家们主要通过基因组比较来理解病毒的进化。然而,RNA 编码的病毒进化速度极快,并且容易从其他生物体获取遗传物质,这意味着基因序列可能掩盖了病毒之间的深层关系。相比之下,病毒基因编码的蛋白质结构变化较慢,有助于揭示这些隐藏的进化联系。但在 AlphaFold 等大规模预测蛋白质结构的工具问世之前,科学家们难以比较整个病毒家族的蛋白质结构。

最近,《Nature》杂志上的一篇论文展示了基于结构的方法在研究黄病毒中的应用。黄病毒家族包括丙型肝炎病毒、登革热病毒和寨卡病毒等,以及一些可能对人类健康构成新威胁的主要动物病原体。研究人员利用 DeepMind 的 AlphaFold2 模型和 Meta 开发的 ESMFold 工具,为 458 种黄病毒物种的蛋白质生成了超过 33,000 个预测结构。ESMFold 基于经过数千万个蛋白质序列训练的语言模型,仅需单个输入序列即可进行预测,因此特别适合研究最神秘的病毒。

预测的结构使研究人员能够识别出与已知黄病毒序列截然不同的病毒入侵蛋白,并发现了一些意想不到的联系。例如,丙型肝炎病毒及其近亲使用的入侵系统与猪瘟病毒中的系统类似。此外,预测结构还揭示了寨卡病毒和登革热病毒中研究透彻的入侵蛋白与某些“奇怪而又奇妙”的黄病毒具有相同的来源。令人惊讶的是,一些黄病毒中似乎存在一种从细菌中窃取的酶。

这些发现不仅有助于理解黄病毒的进化历史,还可能改写其他病毒甚至一些细胞生物的进化史。未来,随着新一代工具的应用,我们将能够更深入地了解这些复杂的生物系统。

本文来源: 机器之心【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...