标签:自回归架构
大语言模型与推理模型进展:ICLR 2025论文分享会自回归架构与多模态大模型趋势解析,迈向AGI北京见
从 OpenAI o1 到 DeepSeek R1,推理模型已经迈入了全新的发展阶段。这些模型展现出的「慢思考、强推理」能力正在加速推动语言智能向认知智能的转变,并为未来的通用人工智能(AGI)奠定了重要基础。与此同时,学术界对大语言模型的研究仍在深入,扩散模型持续挑战主流的自回归架构。随着 2025 年智能体元年的到来,由大语言模型(LLM)驱动的智能体通过手机等移动终端实现落地,彻底改变了人机交互的传统模式。此外,多模态大模型的竞争日益激烈,不仅提升了跨模态的理解与生成能力,还注重低成本和低门槛的应用。 为了帮助...