标签:复杂推理任务
清华人大出品的Search-o1推理模型:自主检索提升复杂推理任务与多跳QA性能,超越人类专家水平
新框架Search-o1:大幅提升推理模型性能,清华人大联合出品 衡宇 白小交 发自 凹非寺 量子位 | 公众号 QbitAI 近日,清华大学和中国人民大学联手推出了一款名为「Search-o1」的新型推理模型框架。该框架在博士级别的科学问答、数学、代码能力等11项评测中表现出色,拿下了10个第一,显著提升了Qwen版o1的成绩。 # 解决推理过程中的“知识不足”问题 传统的推理模型在遇到复杂问题时,常常因为知识不足而卡壳,导致推理链中的错误传递。Search-o1通过引入自主搜索机制,有效解决了这一问题。当模型在推理过程中遇到不确定的...