标签：自回归架构

大语言模型与推理模型进展：ICLR 2025论文分享会自回归架构与多模态大模型趋势解析，迈向AGI北京见

从 OpenAI o1 到 DeepSeek R1，推理模型已经迈入了全新的发展阶段。这些模型展现出的「慢思考、强推理」能力正在加速推动语言智能向认知智能的转变，并为未来的通用人工智能（AGI）奠定了重要基础。与此同时，学术界对大语言模型的研究仍在深入，扩散模型持续挑战主流的自回归架构。随着 2025 年智能体元年的到来，由大语言模型（LLM）驱动的智能体通过手机等移动终端实现落地，彻底改变了人机交互的传统模式。此外，多模态大模型的竞争日益激烈，不仅提升了跨模态的理解与生成能力，还注重低成本和低门槛的应用。为了帮助...

来源：

机器之心【阅读原文】
Tags：AGI 多模态大模型大语言模型推理模型自回归架构

1周前