标签:NAR模型
一种全新的视觉生成范式——邻近自回归建模
近年来,视觉生成任务在人工智能领域中逐渐崭露头角,尤其是在图像和视频生成方面。然而,传统的“下一个token预测”方法在效率上遇到了瓶颈。为了解决这一问题,浙江大学、上海AI Lab等机构的研究团队提出了一种全新的视觉生成范式——邻近自回归建模(Neighboring Autoregressive Modeling, NAR)。 NAR模型通过采用“下一个邻域预测”的机制,将视觉生成过程视为一种逐步扩展的“外绘”过程。具体而言,NAR模型从初始token开始,按照与初始token的曼哈顿距离从小到大依次生成token。这种顺序不仅保留了视觉的空间和时间局部性,...