标签:自监督学习

港大马毅团队等开源新作:用编码率正则化重构视觉自监督学习范式,“少即是多”

简化DINO系列模型训练流程 最新发布的视觉预训练方法由马毅团队、微软研究院和UC伯克利等联合推出。SimDINO和SimDINOv2通过引入编码率正则化,简化了DINO和DINOv2的训练流程,并在性能上取得了显著提升。 在当前的视觉预训练领域,DINO和DINOv2是顶级模型,广泛应用于多模态大模型中的视觉编码器。然而,DINO系列模型的训练过程复杂,需要精心设计的温度调度策略、中心化-锐化操作和高维原型投影层等组件。这些复杂的设置虽然能防止特征崩溃,但也使得训练过程变得异常困难。 为了解决这些问题,SimDINO和SimDINOv2应运而...

LeCun最新万字演讲揭示:从纯语言模型转向人类水平的AI,自监督学习与目标驱动架构成关键,联合嵌入预测开启新纪元,开源AI引领未来方向

LeCun最新演讲:纯语言模型无法达到人类水平,Meta基本放弃 来源:量子位 作者:白小交 日期:2024-10-18 当奥特曼、马斯克、Anthropic CEO纷纷预测AGI将在2026年前后实现时,LeCun却直言这是“胡说八道”。在最新的公开演讲中,LeCun表示,要让系统具备推理、规划和理解物理世界的能力,至少还需要几年甚至十年的时间,才能达到人类水平。 LeCun透露,Meta已经基本放弃了纯语言模型,因为仅通过文本训练,永远无法达到接近人类水平的智能。他强调,当前的大模型存在局限性,需要开发新的目标驱动的AI架构,利用世界模...