标签：数学推理能力

科大讯飞推出全新深度推理模型，基于全国产算力平台，行业大模型助力数学推理能力国内领先，获一线教师高度赞誉

推理模型的兴起与科大讯飞的新突破自OpenAI发布深度推理模型以来，国内外众多企业纷纷跟进推出类似模型。国内市场上，Kimi-k1、GLM-Zero、DeepSeek-r1等模型相继问世。去年年底，OpenAI发布了性能大幅提升的o3模型，为业界注入了新的活力。英伟达CEO黄仁勋在CES演讲中也强调了后训练和推理计算的重要性。今天，作为“AI国家队”的科大讯飞正式推出了其深度推理模型星火X1。该模型依托全国产算力平台，率先在国内落地，并在教育、医疗等领域展现出显著优势。实测结果显示，星火X1能高效处理全学段的数学问题，具备出色的推理...

来源：

智东西【阅读原文】
Tags：全国产算力平台数学推理能力深度推理模型科大讯飞行业大模型

3个月前

仅需格式转换提升9%数学推理能力，上交开源新对齐方法ReAlign

上海交通大学GAIR Lab推出了一种名为ReAlign的新方法，旨在提高大模型的数学推理能力和整体对齐性能，尤其适用于语言模型如ChatGPT。ReAlign通过改进现有数据集质量，降低了人工成本，避免了大模型幻觉问题。该方法开源，包括代码、ReAlign处理后的数据集、任务描述和格式、分类器以及评估工具。 ReAlign的优势在于提高了数学推理能力，如LLaMA-2-13B在GSM8K上的表现提升9%，并增强了模型的泛化能力。它与现有对齐技术兼容，可以改善模型的回答可读性和组织结构，同时采用检索增强技术提升事实性，减少幻觉影响。方法包括...

来源：

量子位【阅读原文】
Tags：ReAlign 大模型对齐数学推理能力格式重构检索增强

1年前 (2024)