标签:MOE架构

全面对标GPT-4 Turbo!商汤发布日日新5.0大模型

在近日的北京发布会上,商汤科技推出了最新版人工智能模型——“日日新5.0”,这款模型采用了创新的MOE架构,显著提升了处理复杂任务的效率和精确度。通过深度学习训练超过10TB的数据,日日新5.0具备了200K的推理上下文窗口,能更好地理解和处理长文本及复杂的推理问题。该模型在知识、推理等多个领域与GPT-4 Turbo相媲美,展示出强大的综合性能。 日日新是商汤科技构建的大模型体系,包含自然语言处理的“商量”、文生图的“秒画”和数字人视频生成的“如影”等多个组件,协同工作以提供多元化服务。该体系由商汤科技CEO徐立于2023年...