特斯拉CEO马斯克近期推出了Grok模型的最新升级版——Grok 1.5,该模型在推理能力和上下文处理上实现了显著提升。新版本的Grok上下文长度增加至128k,与GPT-4相当,这意味着它可以更好地理解和处理复杂及长篇幅的输入。在推理性能上,Grok 1.5在数学和编程任务上的表现超过了GPT-4和其他一些知名大模型。在MATH和HumanEval基准测试中,Grok 1.5取得了优异的成绩。值得注意的是,Grok 1.5采用了独特的分布式训练架构,不依赖Python和Pytorch,而是利用Rust、JAX和Kubernetes进行构建,并拥有自定义训练协调器以提高训练效率和稳定性。新版本预计会先提供给早期测试者,随后将正式上线。
本文来源: 量子位【阅读原文】© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...