标签:LiveBench
Deepseek-v3开源LLM新模型意外曝光!编程跑分在LiveBench上一举超越Claude 3.5 Sonnet,MoE架构助力性能飞跃
Deepseek新模型意外曝光,编程跑分超越Claude 3.5 Sonnet,登顶LiveBench最强开源LLM宝座 近日,Deepseek-v3在未正式宣布的情况下意外曝光,并迅速引发广泛关注。据Reddit网友爆料,Deepseek-v3已在API和网页上发布,多个评测榜单也相继出炉。 在Aider多语言编程测试排行榜中,Deepseek-v3一举超越了Claude 3.5 Sonnet,紧随o1之后位列第二,完成率从v2.5的17.8%大幅提升至48.4%。同时,在LiveBench测评中,Deepseek-v3成为当前最强的开源大语言模型(LLM),在非推理模型中仅次于gemini-exp-1206,排名第二。 目前,Hugg...