马斯克近期做出了一个重大决定,开源了名为Grok-1的大型语言模型,使其成为目前参数量最大的开源模型,拥有3140亿参数,超过OpenAI的GPT-3.5。Grok-1的开源封面图由Midjourney生成,象征着“AI帮助AI”的理念。该模型遵循Apache 2.0协议,允许用户自由使用、修改和分发,无论个人还是商业。尽管使用Grok-1可能需要大量GPU内存,但其开源性质已吸引了大量关注,GitHub上的星标数量不断攀升。
Grok-1由马斯克的AI初创公司xAI在四个月内开发完成,先期的Grok-0模型在标准测试中表现接近Meta的Llama2。经过优化,Grok-1在HumanEval和MMLU任务中取得了优异成绩,超越了包括ChatGPT-3.5在内的其他模型。xAI指出,Grok-1的独特之处在于它未经特定任务微调,且能实时获取世界信息,处理复杂问题。此外,Grok-1的Mixture-of-Experts结构和大量的活跃权重比例赋予了其强大的语言处理能力。未来,Grok-1将应用于各种自然语言处理任务,并探索长上下文理解等领域。
本文来源: 财联社【阅读原文】© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...