商汤发布日日新 5.0 大模型:推理上下文窗口 200K,号称对标 GPT-4 Turbo

近日,商汤科技推出了全新的日日新5.0大模型,这款模型运用了MOE混合专家架构,显著提升了其在知识、数学、逻辑推理和编程能力方面的性能。经过超过10TB的数据训练,该模型拥有200K的推理上下文窗口,可与GPT-4 Turbo相媲美。日日新5.0不仅支持自然语言处理、图像生成等功能,还能进行定制化模型训练,满足不同领域的需求。

在文科应用上,模型的创新能力与推理总结能力得到增强,对教育和内容创作等行业有积极的辅助作用。而在理科领域,其强化了数理逻辑、代码理解和推理技能,为金融和数据分析等实际场景提供了坚实的技术支持。目前,日日新5.0已全面开放给所有用户使用。值得一提的是,商汤科技的大模型技术还被应用于小米汽车SU7的智能座舱,通过小爱同学为驾驶者带来智能交互体验。

文章中提及的广告声明指出,任何外部链接仅用于传递信息,不代表IT之家立场,所有内容仅供参考。

本文来源: IT之家【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...