中国科学技术大学利用深度学习与分子动力学模拟，通过PATHpre实现高精度蛋白质构象变化预测

蛋白质构象变化是计算生物学和人工智能领域的重要挑战之一。尽管主流算法如 AlphaFold 能够高效预测蛋白质的静态结构，但在预测构象变化方面仍存在局限。为了突破这一瓶颈，中国科学技术大学和上海科技大学的研究团队提出了一种创新的深度学习方法，通过高通量生物物理采样来克服蛋白质构象变化数据稀缺的问题。

大规模数据库的构建

研究人员将分子动力学模拟与增强采样技术相结合，创建了一个包含 2635 种已知两种稳定状态的蛋白质构象变化的大规模数据库。每个转变途径的结构信息都被详细记录，形成了一个丰富的数据资源。这一数据库为开发能够预测蛋白质转变途径的通用深度学习模型奠定了基础。

深度学习模型的开发与验证

利用上述数据库，研究团队开发了一个名为 PATHpre 的深度学习模型，该模型能够在多种蛋白质序列长度（从 44 到 704 个氨基酸）下表现出稳定的预测能力。PATHpre 模型不仅能够处理不同类型的构象变化，而且在多个系统中，其预测结果与实验数据高度一致。特别是在人类 β-心脏肌球蛋白中，该模型成功识别了一种新的变构调控机制，展示了其在实际应用中的潜力。

模型的优势与应用前景

与现有的蛋白质构象变化模型相比，PATHpre 具有以下几个显著优势：
1. 数据驱动：模型使用模拟数据进行训练，避免了对潜在空间线性路径的假设。
2. 通用性强：适用于所有蛋白质，无需针对每种蛋白质进行单独再训练。
3. 聚焦大构象变化：专注于 RMSD > 5 Å 的蛋白质构象变化，这对于药物设计尤为重要。

该研究发表在《Advanced Science》上，为蛋白质构象变化的预测提供了新的思路和工具，有望在生物医学研究中发挥重要作用。

本文来源：