生命科学进入大模型时代
生命科学领域已经率先进入基础模型时代。今年,化学诺贝尔奖授予了AlphaFold,AI+Science受到了前所未有的关注。第三届中国生物计算大会上,全球规模最大的生命科学基础模型xTrimo V3正式发布,参数规模达2100亿,覆盖蛋白质、DNA、RNA、细胞等七大主流模态。该模型由李彦宏孵化创办的百图生科推出,旨在解码生命语言,助力药物研发、精准医疗等领域的创新。
xTrimo V3的技术亮点
xTrimo V3是目前全球规模最大的生命科学基础模型,总体参数规模达到2100亿。参数规模越大,意味着模型蕴含更广泛的知识和更强的泛化能力,从而在关键问题和任务的解决上表现出更强的性能和准确性。截至目前,xTrimo基础大模型平台在200个任务模型中达到SOTA水平,实现了从头设计全新蛋白质、靶点发现等创新生物项目的突破。
多模态覆盖与应用
xTrimo V3覆盖了DNA、RNA、蛋白质、细胞、小分子、生物视觉和生物知识文本等生命科学七大主流模态。这种多模态覆盖使得模型能够在不同领域实现跨模态协作,从而支持从分子早期研发到生产放大再到后期实验分析的全流程AI建模需求。例如,在靶点发现过程中,模型可以通过蛋白质和细胞的表征、生物基因注释的文本模态生成扰动编码,预测扰动后的表达量变化,并推荐潜在的靶点。
行业生态与基础设施
百图生科不仅推出了基础大模型,还建设了一站式模型平台,相当于生命科学领域的大模型基础设施。该平台提供了生物多模态的统一训练框架,支持从跨模态预训练到下游任务的微调。推理端则量身定制了生物与AI融合的计算引擎,实现了多个场景下十倍以上的推理性能提升。此外,平台还配备了系列工具链,包括Model Builder、Model Hub和Model Booster等模块,为用户提供全方位的AI模型服务。
应用案例与未来展望
百图生科利用亲和力模型设计出多个亲和力梯度的抗体,并通过高通量亲和力检测和复杂构型双抗的表达与验证,最终交付了具有更佳治疗窗口的双抗。过去四年间,百图生科的全球用户已超过300家,总订单超20亿美元,初步完成了技术和商业验证的闭环。未来,百图生科的目标行业将扩展到生物医药、生物制造、科研教育等领域,进一步推动大模型在生命科学领域的应用。