今年2月,著名学者何恺明开启了他在麻省理工学院(MIT)的副教授生涯。3月7日,他完成了自己职业生涯中的第一堂课。最近,我们发现何恺明开设了第二门课程——《深度生成模型》(6.S978: Deep Generative Models),该课程已于9月初正式开课。
这门课程由何恺明主讲,同时,MIT CSAIL计算设计与制造团队的四年级博士生Minghao Guo担任助教。许多网友纷纷推荐这门课程,认为它对准备教授计算机视觉与深度学习的人士非常有帮助。网友们还特别提到,何恺明是残差网络(ResNet)的发明者,学术成就卓越。然而,能够掌握这门课程所需先修知识的人并不多,因此课程难度较高,需要较为扎实的学习背景。
根据课程介绍,这是一门面向研究生的研讨会课程,主要针对正在进行或计划进行深度生成模型研究的学生。课程涵盖了深度生成模型的基本概念、原理及其在计算机视觉(如图像、视频、几何)和相关领域(如机器人技术、生物学、材料科学等)的应用。课程重点在于探讨不同问题和学科之间的通用范式和方法。
核心主题包括变分自编码器(VAE)、自回归模型(AR)、生成对抗网络(GAN)、扩散模型及其应用。课程不仅涵盖基础框架,还包括最新的研究前沿。课程形式多样,包括讲师讲座、客座讲座和学生研讨会。学生研讨会包括论文阅读、演示和讨论。
课程对学生的要求非常高,具体包括:
– 参加所有讲座和研讨会
– 每两周完成一次习题集
– 在研讨会上发表一篇论文(20分钟演示 + 10分钟讨论和QA)
– 完成最终项目和项目演示
课程共分为15周完成,除了第1周和最后一周,每周都有两节课(分别为阅读课和讲座)。目前,课程已经进行到第10周,各周的主题如下:
– Week 1:深度生成模型简介
– Week 2:建模图像先验、变分自编码器(VAE)
– Week 3:归一化流、自回归(AR)模型
– Week 4:自回归(AR)模型、AR 和分词器(tokenizer)
– Week 5:AR 和扩散、生成对抗网络(GAN)
– Week 6:扩散领域的 GAN
– Week 7:基于能量的模型、分数匹配和扩散模型
– Week 8:扩散模型、去噪后的扩散
– Week 9:离散扩散、流匹配 1
– Week 10:流匹配 2、CMU 助理教授朱俊彦讲座《确保生成模型的数据所有权》(Ensuring Data Ownership in Generative Models)
前5期讲座的PPT已发布,详细地址如下:
– [Week 1](https://mit-6s978.github.io/assets/pdfs/lec1_intro.pdf)
– [Week 2](https://mit-6s978.github.io/assets/pdfs/lec2_vae.pdf)
– [Week 3](https://mit-6s978.github.io/assets/pdfs/lec3_ar.pdf)
– [Week 4](https://mit-6s978.github.io/assets/pdfs/lec4_gan.pdf)
– [Week 5](https://mit-6s978.github.io/assets/pdfs/lec5_diffusion.pdf)
未来的课程主题将涉及视频、3D、几何、机器人、材料科学、蛋白质和生物学等领域的应用。此外,OpenAI战略探索团队负责人宋飏还将带来讲座《一致性模型》(Consistency Models)。
本文来源: 机器之心【阅读原文】