标签:模型

扎克伯格大招被扒光!开源大模型打脸GPT-4o商业化路径也已隐现

Meta的LLaMA 3.1 405B:一场开源AI的胜利? 科技界再次掀起波澜,Meta计划在当地时间7月23日揭晓其最新力作——LLaMA 3.1 405B,一款拥有4050亿个参数的巨无霸模型,具备多模态处理能力,能够轻松应对图像与文本的生成与理解任务。然而,这款备受期待的模型竟在正式亮相前遭遇意外泄露,信息迅速在开源AI社区Hugging Face上流传开来,引发广泛关注。 泄露的细节揭示,LLaMA 3.1 405B在多项关键AI基准测试中的表现令人瞩目,甚至超越了竞争对手Claude 3.5 Sonnet,成为MMLU-Pro评估中的新王者。虽然在某些特定测试中稍显逊色...

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

随着OpenAI的GPT-4o mini、Mistral AI的Mistral NeMo,以及HuggingFace的小模型相继亮相,小模型市场正迅速升温。苹果最新加入这场竞争,推出了DCLM小模型,以其卓越性能和全面开源策略引发业界关注。 苹果推出的DCLM小模型拥有70亿和14亿参数两个版本,其中70亿参数版本超越了Mistral-7B,性能接近Llama3和Gemma。苹果的研究科学家Vaishaal Shankar强调,DCLM是目前性能最佳的真正开源模型,提供完整权重和训练代码,基于开放数据集DCLM-Baseline。苹果的这一举措赢得了广泛好评,与多数科技巨头的闭源模型形成鲜明对比。 ...