马斯克斥资20万块GPU打造Grok-3 AI模型，凭借强大推理能力在数学领域暴击DeepSeek R1，深度搜索性能远超OpenAI，彰显大规模GPU训练优势

马斯克口中最强AI模型Grok-3震撼登场

近日，马斯克带领xAI团队正式发布了全球最强大的大模型Grok-3。这款模型使用了20万块GPU进行训练，是人类历史上首次在如此大规模的硬件集群上完成的训练任务。Grok-3一经发布便迅速席卷多个排行榜，击败了o3-mini（high）和DeepSeek-R1等强劲对手。

Grok-3的技术亮点

Grok-3的训练计算量达到了惊人的10倍于Grok-2，其背后支撑的是世界最大的超算集群Colossus，该集群拥有20万块GPU。第一阶段用时122天搭建了10万块GPU，第二阶段再用92天完成了全部20万块GPU的配置。在多项基准测试中，Grok-3在数学（AIME2024）、科学问答（GPQA）、编码（LCB）等方面刷新了SOTA记录，大幅超越了其他模型如DeepSeek-V3、Gemini-2Pro和GPT-4o。

强大的推理能力

Grok-3不仅在性能上领先，还带来了全新的推理模型——Grok-3Reasoning。用户可以通过「Think」模式开启魔法般的推理体验，甚至可以查看Grok-3的思维过程。此外，还有「Big Brain」模式和智能体「深度搜索」（Deep Search）模式同步上线，进一步增强了其应用范围。

实际应用场景展示

Grok-3在实际应用中的表现令人惊艳。例如，在生成地球发射、火星着陆及返回地球的3D动画代码时，Grok-3成功解决了复杂的数学和物理问题。这一成果不仅展示了其强大的推理能力，还为未来的太空探索提供了技术支持。另一个例子是结合俄罗斯方块和宝石迷阵的游戏开发，Grok-3通过Python编写代码，成功创建了一个混合游戏，并且界面美观。

智能体DeepSearch

除了核心模型，Grok-3还推出了首个智能体DeepSearch。它能够在互联网上进行更深入的搜索，提供详细合理的答案，并且信息检索过程对用户透明。DeepSearch不仅能回答复杂的问题，还能提供具体的解决方案和参考链接，大大提高了用户的使用体验。

开放与未来展望

马斯克表示，订阅Premium Plus的X用户现已可以使用Grok-3。忠实粉丝可以通过单独订阅SuperGrok解锁更多功能。Grok-3计划在未来几个月内全面开源，让更多开发者能够参与到这个项目中来。此外，Grok-3还将在几周内推出API接口和语音助手版本，进一步扩展其应用范围。

数据中心与能源优化

为了支持Grok-3的训练，xAI团队在孟菲斯建立了一个高效的数据中心，使用特斯拉的Megapacks供电，并实现了液冷技术的应用。团队还重新设计了建筑物的能源供给，确保数据中心的高效运行。未来，他们将继续优化能耗，争取将耗能从1/4吉瓦降低到更低水平。

专家评价

提前拿到内测资格的AI专家Karpathy对Grok-3进行了详细评测，认为其推理模型最为领先，尤其在解决复杂问题时表现出色。他还指出，Grok-3的「深度搜索」功能结合了思考和研究的能力，能够提供高质量的回答和参考链接。

本文来源：