标签:后训练
ChatGPT后训练方法被OpenAI前高管公开,PPT全网传播
近日,OpenAI的两位前高管John Schulman和Barret Zoph在离开公司后,将ChatGPT的后训练方法整理成PPT并公开发布。这两位曾在OpenAI担任后训练研究的重要角色,因此他们对这一领域的见解备受关注。 背景介绍 John Schulman是OpenAI的联合创始人之一,曾负责后训练工作;Barret Zoph则曾任后训练研究副总裁。他们在斯坦福大学进行了一场关于后训练及ChatGPT开发经验的演讲,并通过社交媒体分享了PPT。遗憾的是,演讲视频未能录制下来,但观众们纷纷点赞收藏,证明了其的高质量。 后训练阶段详解 后训练是模型开发的最后一...