马斯克斥资20万块GPU打造Grok-3 AI模型,凭借强大推理能力在数学领域暴击DeepSeek R1,深度搜索性能远超OpenAI,彰显大规模GPU训练优势
马斯克口中最强AI模型Grok-3震撼登场
近日,马斯克带领xAI团队正式发布了全球最强大的大模型Grok-3。这款模型使用了20万块GPU进行训练,是人类历史上首次在如此大规模的硬件集群上完成的训练任务。Grok-3一经发布便迅速席卷多个排行榜,击败了o3-mini(high)和DeepSeek-R1等强劲对手。
Grok-3的技术亮点
Grok-3的训练计算量达到了惊人的10倍于Grok-2,其背后支撑的是世界最大的超算集群Colossus,该集群拥有20万块GPU。第一阶段用时122天搭建了10万块GPU,第二阶段再用92天完成了全部20万块GPU的配置。在多项基准测试中,Grok-3在数学(AIME2024)、科学问答(GPQA)、编码(LCB)等方面刷新了SOTA记录,大幅超越了其他模型如DeepSeek-V3、Gemini-2Pro和GPT-4o。
强大的推理能力
Grok-3不仅在性能上领先,还带来了全新的推理模型——Grok-3Reasoning。用户可以通过「Think」模式开启魔法般的推理体验,甚至可以查看Grok-3的思维过程。此外,还有「Big Brain」模式和智能体「深度搜索」(Deep Search)模式同步上线,进一步增强了其应用范围。
实际应用场景展示
Grok-3在实际应用中的表现令人惊艳。例如,在生成地球发射、火星着陆及返回地球的3D动画代码时,Grok-3成功解决了复杂的数学和物理问题。这一成果不仅展示了其强大的推理能力,还为未来的太空探索提供了技术支持。另一个例子是结合俄罗斯方块和宝石迷阵的游戏开发,Grok-3通过Python编写代码,成功创建了一个混合游戏,并且界面美观。
智能体DeepSearch
除了核心模型,Grok-3还推出了首个智能体DeepSearch。它能够在互联网上进行更深入的搜索,提供详细合理的答案,并且信息检索过程对用户透明。DeepSearch不仅能回答复杂的问题,还能提供具体的解决方案和参考链接,大大提高了用户的使用体验。
开放与未来展望
马斯克表示,订阅Premium Plus的X用户现已可以使用Grok-3。忠实粉丝可以通过单独订阅SuperGrok解锁更多功能。Grok-3计划在未来几个月内全面开源,让更多开发者能够参与到这个项目中来。此外,Grok-3还将在几周内推出API接口和语音助手版本,进一步扩展其应用范围。
数据中心与能源优化
为了支持Grok-3的训练,xAI团队在孟菲斯建立了一个高效的数据中心,使用特斯拉的Megapacks供电,并实现了液冷技术的应用。团队还重新设计了建筑物的能源供给,确保数据中心的高效运行。未来,他们将继续优化能耗,争取将耗能从1/4吉瓦降低到更低水平。
专家评价
提前拿到内测资格的AI专家Karpathy对Grok-3进行了详细评测,认为其推理模型最为领先,尤其在解决复杂问题时表现出色。他还指出,Grok-3的「深度搜索」功能结合了思考和研究的能力,能够提供高质量的回答和参考链接。
本文来源: