标签：LiveBench

Deepseek-v3开源LLM新模型意外曝光！编程跑分在LiveBench上一举超越Claude 3.5 Sonnet，MoE架构助力性能飞跃

Deepseek新模型意外曝光，编程跑分超越Claude 3.5 Sonnet，登顶LiveBench最强开源LLM宝座近日，Deepseek-v3在未正式宣布的情况下意外曝光，并迅速引发广泛关注。据Reddit网友爆料，Deepseek-v3已在API和网页上发布，多个评测榜单也相继出炉。在Aider多语言编程测试排行榜中，Deepseek-v3一举超越了Claude 3.5 Sonnet，紧随o1之后位列第二，完成率从v2.5的17.8%大幅提升至48.4%。同时，在LiveBench测评中，Deepseek-v3成为当前最强的开源大语言模型（LLM），在非推理模型中仅次于gemini-exp-1206，排名第二。目前，Hugg...

来源：

量子位【阅读原文】
Tags：Deepseek-v3 LiveBench MOE架构开源LLM 编程跑分

3个月前