标签:推理大模型
新研究揭示DeepSeek弱点:频繁切换思路欠思考,最短答案往往就对
深度解析DeepSeek推理模型的弱点:频繁切换思路与欠思考现象 近年来,随着AI技术的迅猛发展,像DeepSeek和Qwen这样的推理大模型不断给人类带来惊喜。然而,最近的研究揭示了这些模型在处理高难度问题时的一个显著弱点——频繁切换解题思路,导致“欠思考”(Underthinking)现象。 国内外团队联合研究揭示问题 来自腾讯AI实验室、苏州大学和上海交通大学的研究团队对开源的DeepSeek-R1和Qwen QwQ系列模型进行了深入分析。研究表明,这些模型在遇到复杂问题时,常常表现出类似“三心二意”的行为,即频繁切换解题思路,而未能深...