GPT-4 Turbo首次被击败!国产大模型拿下总分第一

商汤科技的最新大模型日日新5.0(SenseChat V5)在SuperCLUE中文大模型测评基准中取得了历史性的突破,以80.03分的总分超过GPT-4 Turbo的79.13分,成为新的榜首。这款国产模型在综合、文科领域刷新了国内最佳成绩,理科方面也保持国内领先。SenseChat V5在文科测试中得分82.20分,超过了GPT-4 Turbo,而理科测试虽未超越GPT-4 Turbo,但仍在国内大模型中排名第一。此外,模型在国内外平均水平对比中表现出色,尤其在文科能力上优于国外选手。商汤科技采用MoE架构,大规模训练数据,以及创新的训练策略,提升了模型的推理和表达能力。尽管评分是衡量模型性能的一个方面,但实际应用效果同样重要。SenseChat V5已经在“商量”在线对话应用中集成,通过逻辑、数学和中文理解的测试,展示出强大的解决问题能力。

本文来源: 量子位【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...