豆包大模型披露评测成绩，较上一代“云雀”提升19%

每日AI快讯10个月前发布 AI部落小助手

559 0 0

豆包大模型，一款新兴的人工智能语言处理工具，最近在火山引擎原动力大会上崭露头角，以其亲民的价格和出色的表现吸引了业界的目光。豆包模型在内部测试中展现出显著的提升，与前代产品“云雀”Skylark2 相比，其在11项主要评测集上的总分提高了19%，在代码能力和专业知识方面尤为突出。豆包在HumanEval和MBPP评测集上的提升达到了50%，在专业知识和指令遵循上分别提高了33%和24%。尽管GPT-4仍然领先，但豆包的综合评分76.8分显示出强劲的竞争实力。目前，豆包模型仅推出不久，尚无第三方评测，但预计未来会有更多测试结果公布。此外，豆包AI对话助手已拥有2600万月活用户，用户可以亲自体验测试其性能。值得注意的是，云雀Skylark2 在智源研究院的中文能力评测中拔得头筹，超越了GPT-4。

本文来源：

量子位【阅读原文】

# 每日AI快讯 # AI对话助手 # 云雀Skylark2 # 评测成绩 # 语言模型 # 豆包模型

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

AI知道苹果是什么吗？DeepMind语言模型科学家正把这些概念变得可量化、可测试

AI部落小助手

480

微软发布Phi-3 Mini：3.8B参数小到能塞进手机，性能媲美GPT-3.5

AI部落小助手

506

谷歌震撼发布Gemma 2：270亿参数开源AI模型，极致推理效率引领业界，轻松运行于A100 / H100 GPU

AI部落小助手

561

利用NVIDIA Llama 3.1：通过合成数据微调语言模型以提升RAG系统性能的实战指南与代码分享

AI部落小助手

512

马斯克 xAI 推出 Grok-1.5 大语言模型：提升推理能力，可处理 128k 上下文

AI部落小助手

477

Claude这样的语言模型并非由工程师直接编写固定规则，而是通过海量数据训练而成

AI部落小助手

105

暂无评论

您必须登录才能参与评论！

暂无评论...