标签：推理大模型

新研究揭示DeepSeek弱点：频繁切换思路欠思考，最短答案往往就对

深度解析DeepSeek推理模型的弱点：频繁切换思路与欠思考现象近年来，随着AI技术的迅猛发展，像DeepSeek和Qwen这样的推理大模型不断给人类带来惊喜。然而，最近的研究揭示了这些模型在处理高难度问题时的一个显著弱点——频繁切换解题思路，导致“欠思考”（Underthinking）现象。国内外团队联合研究揭示问题来自腾讯AI实验室、苏州大学和上海交通大学的研究团队对开源的DeepSeek-R1和Qwen QwQ系列模型进行了深入分析。研究表明，这些模型在遇到复杂问题时，常常表现出类似“三心二意”的行为，即频繁切换解题思路，而未能深...

来源：

量子位【阅读原文】 Tags：DeepSeek 推理大模型

2个月前