标签:上下文长度

马斯克突发Grok 1.5!上下文长度至128k、HumanEval得分超GPT-4

特斯拉CEO马斯克近期推出了Grok模型的最新升级版——Grok 1.5,该模型在推理能力和上下文处理上实现了显著提升。新版本的Grok上下文长度增加至128k,与GPT-4相当,这意味着它可以更好地理解和处理复杂及长篇幅的输入。在推理性能上,Grok 1.5在数学和编程任务上的表现超过了GPT-4和其他一些知名大模型。在MATH和HumanEval基准测试中,Grok 1.5取得了优异的成绩。值得注意的是,Grok 1.5采用了独特的分布式训练架构,不依赖Python和Pytorch,而是利用Rust、JAX和Kubernetes进行构建,并拥有自定义训练协调器以提高训练效率和稳...