GPT-4 Turbo首次被击败！国产大模型拿下总分第一

每日AI快讯11个月前发布 AI部落小助手

548 0 0

商汤科技的最新大模型日日新5.0（SenseChat V5）在SuperCLUE中文大模型测评基准中取得了历史性的突破，以80.03分的总分超过GPT-4 Turbo的79.13分，成为新的榜首。这款国产模型在综合、文科领域刷新了国内最佳成绩，理科方面也保持国内领先。SenseChat V5在文科测试中得分82.20分，超过了GPT-4 Turbo，而理科测试虽未超越GPT-4 Turbo，但仍在国内大模型中排名第一。此外，模型在国内外平均水平对比中表现出色，尤其在文科能力上优于国外选手。商汤科技采用MoE架构，大规模训练数据，以及创新的训练策略，提升了模型的推理和表达能力。尽管评分是衡量模型性能的一个方面，但实际应用效果同样重要。SenseChat V5已经在“商量”在线对话应用中集成，通过逻辑、数学和中文理解的测试，展示出强大的解决问题能力。

本文来源：

量子位【阅读原文】

# 每日AI快讯 # GPT-4 Turbo # SuperCLUE # 商汤科技 # 大模型测评 # 日日新5.0

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

科大讯飞星火大模型在教育医疗领域超越GPT-4 Turbo，联手华为打造人工智能智算平台，助力小艺声音修复技术革新

AI部落小助手

385

商汤科技的AI技术在奥运会中亮相：其商业化与算力储备的应用探索及体育领域的实践效果

AI部落小助手

770

商汤科技完成战略重组，1+X架构助力AI 2.0与生成式AI核心业务发展

AI部落小助手

305

商汤发布日日新 5.0 大模型：推理上下文窗口 200K，号称对标 GPT-4 Turbo

AI部落小助手

540

全面对标GPT-4 Turbo！商汤发布日日新5.0大模型

AI部落小助手

511

商汤科技徐冰深度访谈：探索AI云平台与超级应用的算力需求及数万亿投资回报前景

AI部落小助手

441

暂无评论

您必须登录才能参与评论！

暂无评论...