标签:计算机科学家
AI知道苹果是什么吗?DeepMind语言模型科学家正把这些概念变得可量化、可测试
计算机科学家Ellie Pavlick专注于研究大语言模型(LLM)的理解能力,探讨了语言模糊性的本质以及如何寻找模型中意义的证据。Pavlick指出,语言模型的“理解”涉及到单词的概念和意义,而这些概念可能独立于语言本身存在,如感官知觉和社会互动。她通过研究模型如何编码语义,寻找内部结构,以证明模型是否真正理解语言。一个例子是模型如何处理不同国家的首都信息,显示了模型可能总结和应用通用算法的能力。此外,Pavlick还讨论了“基础”(grounding)的概念,即语言如何与非语言输入相关联,以形成意义。尽管面临挑战,如避免...