UMedPT模型在外部独立验证中表现出色,仅1%原始数据可达最佳性能

生物医学成像领域,基础模型的预训练已成为一项关键技术,但受限于小规模和专业化的数据集。德国弗劳恩霍夫数字医学研究所(Fraunhofer MEVIS)的研究团队提出了一种创新的多任务学习策略,以解决数据稀缺的问题。他们开发的通用生物医学预训练模型UMedPT)在多种成像任务上进行训练,包括CT、显微镜和X射线图像,采用分类、分割和物体检测等多种标记策略。

UMedPT模型在外部独立验证中表现出色,其成像特征的跨中心可转移性达到了新的高度。研究发表在2024年7月的《Nature Computational Science》上,题为“克服生物医学成像中的数据稀缺问题”。深度学习在生物医学图像分析中的应用日益广泛,但通常需要大量的标注数据,而这在生物医学领域往往是不足的。多任务学习(MTL)提供了解决方案,通过共享特征提高任务性能,即使在数据有限的情况下也能适用。

MEVIS研究所的研究人员设计了一种多任务训练策略和相应的模型架构,能处理不同模态、疾病和标签类型的数据,以进行大规模预训练。他们采用基于梯度累积的训练循环来应对内存限制,并构建了一个包含共享块和特定任务头的神经网络架构,确保通用特征的提取和特定任务的处理。

实验结果显示,UMedPT在领域内和领域外的任务中都展现出与ImageNet预训练模型相媲美或超越的性能,特别是在数据量有限的情况下。此外,UMedPT在冻结编码器配置和微调设置中,都显示出对减少训练数据的依赖性。这一成果为罕见疾病和儿科影像等数据稀缺领域的深度学习应用开辟了新的道路。

本文来源: 机器之心【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...