标签:Long Range Arena

8/8/6/3的Mamba论文,最终还是被ICLR 2024拒了,网友:悬着的心终于死了

ICLR 2024 拒绝了备受关注的 Mamba 论文,尽管它曾被誉为 Transformer 的强有力挑战者。Mamba,一种选择性状态空间模型,因其在语言建模上的卓越表现和线性扩展能力而受到热议。然而,审稿人指出论文在评估方法上存在问题。主要问题包括缺乏长序列建模基准 LRA 的结果和对困惑度作为主要评估指标的质疑。尽管两位审稿人给予正面评价,但一位资深专家提出,低困惑度不一定代表实际NLP应用的改进。论文在反驳阶段未能充分解决这些问题,导致被拒。这一事件让人联想到十年前 Word2vec 的首次投稿被 ICLR 拒绝,但后来在 NeurIPS...