标签:– 预训练蛋白质语言模型

北京大学的研究团队开发了一个基于序列的深度学习模型

人类必需蛋白(Human Essential Proteins, HEP)对个体的生存和发育至关重要。然而,传统的实验方法鉴定 HEP 通常成本高昂且耗时。此外,现有的计算方法主要在细胞系水平上预测 HEP,但 HEP 在活体人类、细胞系和动物模型中存在显著差异。为此,北京大学的研究团队开发了一个基于序列的深度学习模型——蛋白质重要性计算器(Protein Importance Calculator, PIC),通过微调预训练的蛋白质语言模型,实现了对 HEP 的全面预测。 PIC 模型不仅在预测性能上远超现有方法,还能够在人类、细胞系和小鼠三个层面上进行全面预测。研...