近年来,特斯拉创始人埃隆·马斯克一直致力于推动公司的超级计算机Dojo项目,这被视为支撑特斯拉人工智能战略的关键。近期,随着特斯拉计划于10月推出Robotaxi,公司对Dojo的投资力度进一步加大。据马斯克透露,特斯拉正在打造一个由大约10万个H100/H200 GPU组成的超级计算机集群,旨在强化全自动驾驶(FSD)技术和Optimus机器人项目的视频训练能力。
早在2021年的特斯拉AI日上,马斯克就首次公开了Dojo项目。经过几年的发展,该项目已取得显著进展。目前,Dojo已在线运行,并承担了多项实用任务。马斯克预计,到2024年10月,Dojo的总计算能力将达到100 exaflops。为了实现这一目标,特斯拉需要大量的D1芯片或A100 GPU。值得注意的是,D1芯片具有500亿个晶体管,尽管在某些方面不如英伟达的A100强大,但其独特的设计使其在特定任务上表现出色。
为了提高带宽和算力,特斯拉AI团队将25个D1芯片集成到一个tile中,形成一个统一的计算系统。每个tile拥有9 petaflops的算力和每秒36 TB的带宽,并包含电力、冷却和数据传输硬件。六个这样的tile构成一个机架,两个机架构成一个机柜,十个机柜则构成一个ExaPOD。特斯拉计划通过部署多个ExaPOD来扩展Dojo的计算能力,构建超级计算机。
马斯克还表示,尽管目前特斯拉依然依赖英伟达的硬件为Dojo提供算力,但他看到了与英伟达竞争的可能性。特斯拉正积极研发下一代D2芯片,旨在解决信息流瓶颈问题。长远来看,Dojo的成功不仅能推动特斯拉在自动驾驶领域的突破,还可能开辟新的商业模式,甚至影响整个AI行业。
本文来源: 新智元公众号【阅读原文】© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...