蛋白质,生命的基石,参与各种生物过程,其相互作用的研究对揭示细胞功能、药物研发和疾病治疗至关重要。EPFL的Anne-Florence Bitbol团队创新性地提出了一个蛋白质序列配对方法,利用蛋白质语言模型在多序列比对上的训练,尤其适用于小规模数据集。该方法能增强蛋白质复合物结构预测的准确性,克服了深度学习如AlphaFold在预测复合体结构时的局限性。
新方法称为DiffPALM,基于可微分的配对语言模型,通过Masked Language Modeling(MLM)预测同源词匹配,从而高效解析蛋白质间的复杂相互作用。在原核生物蛋白质数据集的基准测试中,DiffPALM的表现优于现有协同进化方法,且在提供已知相互作用对时性能提升显著。
DiffPALM的潜力不仅限于基础研究,它在医学研究和药物开发中也有广泛应用。准确预测蛋白质相互作用有助于理解疾病机制并开发靶向疗法。研究人员已公开DiffPALM,鼓励科研人员使用以推动计算生物学的进步,并深入探索蛋白质相互作用的奥秘。
这一创新标志着计算生物学的进步,提升了对蛋白质相互作用的理解,为医学研究开辟新路径,有望在疾病治疗和药物发现中实现突破。
本文来源: 机器之心【阅读原文】© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...