知情人士透露,特斯拉将解散其 Dojo 超级计算机团队,其负责人也将离职,这将颠覆该汽车制造商开发无人驾驶技术内部芯片的努力。
据不愿透露姓名、因讨论内部事务而不愿透露姓名的消息人士透露,Dojo 项目负责人彼得·班农 (Peter Bannon) 即将离职,首席执行官埃隆·马斯克 (Elon Musk) 已下令停止该项目。消息人士称,该团队最近有约 20 名员工跳槽至新成立的 DensityAI,剩余的 Dojo 员工将被调往特斯拉内部的其他数据中心和计算项目。
消息人士称,特斯拉计划增加对外部技术合作伙伴的依赖,包括用于计算的 Nvidia 和 Advanced Micro Devices,以及用于芯片制造的三星电子。
据彭博社本周报道,即将正式亮相的DensityAI正在研发芯片、硬件和软件,用于驱动人工智能数据中心,这些数据中心可用于机器人、人工智能代理、汽车应用等多个领域。该公司由Dojo前负责人Ganesh Venkataramanan以及特斯拉前员工Bill Chang和Ben Floering创立。
彭博社报道后,特斯拉股价延续盘后跌势,截至纽约时间下午 5 点 29 分,跌幅不到 1%。
今年,特斯拉面临着核心人才的流失,因为它面临着日益激烈的竞争、销量下滑以及消费者对马斯克政治活动的强烈不满。Optimus 工程主管米兰·科瓦奇 (Milan Kovac) 和软件工程副总裁戴维·刘 (David Lau) 已于今年早些时候离职,而彭博社在 6 月份报道称,马斯克的长期密友奥米德·阿夫沙尔 (Omead Afshar) 也突然离职。
这家电动汽车制造商上个月与三星达成了一项价值 165 亿美元的协议,以确保到 2033 年为止的人工智能半导体供应。该计划是利用即将在德克萨斯州建立的工厂来生产特斯拉的下一代 AI6 芯片,从而使特斯拉的采购渠道多元化,不再局限于领先的芯片制造商台湾半导体制造公司。
马斯克在特斯拉最近一次季度财报电话会议上暗示了一项战略转型,暗示公司未来内部技术的迭代可能会与合作伙伴的技术融合。“考虑到Dojo 3和AI6推理芯片,直觉上,我们希望在那里找到融合点,也就是基本上是同一款芯片,”马斯克在7月23日的电话会议上表示。
特斯拉首席执行官去年承认,公司可能不会永远追求 Dojo,而是更多地依赖外部合作伙伴。
“我们正在寻求英伟达和 Dojo 的双轨发展,”马斯克在 2024 年 1 月表示。“但我认为 Dojo 的前景渺茫。但值得一试,因为回报可能非常高。”
特斯拉Dojo回顾
埃隆·马斯克不想让特斯拉仅仅成为一家汽车制造商。他希望特斯拉成为一家人工智能公司,一家搞清楚如何让汽车实现自动驾驶的公司。
对这项任务至关重要的是Dojo,这是特斯拉定制的超级计算机,旨在训练其全自动驾驶 (FSD) 神经网络。FSD 实际上并非完全自动驾驶;它可以执行部分自动驾驶任务,但仍然需要驾驶员保持专注。但特斯拉认为,随着数据、计算能力和训练的不断提升,它可以从近乎自动驾驶迈向完全自动驾驶。
这就是 Dojo 的作用所在。
马斯克一直在调侃 Dojo,但这位高管在 2024 年期间一直在加紧讨论这款超级计算机。如今已是 2025 年,另一台名为 Cortex 的超级计算机也加入了讨论,但 Dojo 对特斯拉的重要性或许依然生死攸关——随着电动汽车销量下滑,投资者希望特斯拉能够实现自动驾驶。以下是 Dojo 的提及和承诺时间线。
2019,首次提及 Dojo
当年4月22日——在特斯拉自动驾驶日(Autonomy Day)上,这家汽车制造商的人工智能团队登台演讲,探讨了自动驾驶和全自动驾驶,以及驱动两者的人工智能。该公司分享了特斯拉专为神经网络和自动驾驶汽车设计的定制芯片的信息。
发布会上,马斯克透露 Dojo 是一台用于训练人工智能的超级计算机。他还指出,届时生产的所有特斯拉汽车都将配备实现完全自动驾驶所需的所有硬件,只需进行软件更新即可。
2020 年,马斯克开始 Dojo 路演
2 月 2 日——马斯克表示,特斯拉很快将在全球拥有超过一百万辆联网汽车,这些汽车配备了实现完全自动驾驶所需的传感器和计算能力,并大力宣传 Dojo 的功能。
我们的训练超级计算机 Dojo 将能够处理海量视频训练数据,并高效运行具有海量参数、充足内存和超高核心间带宽的超空间阵列。稍后我们将详细介绍。
8月14日—— 马斯克重申特斯拉计划开发一款名为Dojo的神经网络训练计算机,旨在“处理真正海量的视频数据”,并称其为“一头野兽”。他还表示,Dojo的第一个版本“大约需要一年时间”才能发布,这意味着它的发布日期将在2021年8月左右。
12月 31日 ——埃隆表示, Dojo并非必需,但它会让自动驾驶变得更好。“仅仅比人类驾驶员更安全是不够的,Autopilot最终需要比人类驾驶员安全10倍以上。”
2021年,特斯拉正式推出 Dojo
8月19日——特斯拉在首届“AI Day”上正式宣布推出Dojo超级计算机,旨在吸引工程师加入特斯拉的AI团队。特斯拉还推出了其D1芯片,并表示将与英伟达的GPU一起为Dojo超级计算机提供动力。特斯拉指出,其AI集群将容纳3000块D1芯片。
10 月 12 日——特斯拉发布Dojo 技术白皮书 ,题为“特斯拉可配置浮点格式和算法指南”。该白皮书概述了一种新型二进制浮点算法的技术标准,该算法用于深度学习神经网络,可以“完全以软件、完全以硬件或任何软件和硬件的组合”实现。
2022年。特斯拉公布 Dojo 进展
8 月 12 日——马斯克表示,特斯拉将“逐步采用 Dojo。明年将不再需要购买那么多增量 GPU。”
9月30日——在特斯拉第二届人工智能日(AI Day)上,该公司宣布已安装首个Dojo机柜,并进行了2.2兆瓦的负载测试。特斯拉表示,他们每天构建一块芯片(由25块D1芯片组成)。特斯拉在台上演示了Dojo,并运行稳定扩散模型,创建了一幅由AI生成的“火星赛博卡车”图像。
重要的是,该公司设定了完整的 Exapod 集群完成目标日期,即 2023 年第一季度,并表示计划在帕洛阿尔托建造总共 7 个 Exapod。
2023年。“不太可能的赌注”
4 月 19 日——马斯克在特斯拉第一季度财报发布会上告诉投资者,Dojo“有可能将培训成本提高一个数量级”,并且“有可能成为一种可销售的服务,我们会像亚马逊网络服务提供网络服务一样向其他公司提供这种服务”。
马斯克还指出,他“将 Dojo 视为一种不太可能成功的赌注”,但“值得一试”。
6月21日——特斯拉AI X账号发布消息称,该公司的神经网络已经应用于客户车辆。该帖子包含一张图表,展示了特斯拉当前和预计的计算能力时间表,其中显示Dojo将于2023年7月投产,但目前尚不清楚这指的是D1芯片还是超级计算机本身。马斯克当天 表示,Dojo已经上线并在特斯拉数据中心运行任务。
该公司还预测,到 2024 年 2 月左右,特斯拉的计算能力将跻身全球前五(没有迹象表明这一预测成功),到 2024 年 10 月,特斯拉的计算能力将达到 100 exaflops。
7月19日——特斯拉在第二季度财报中指出,Dojo电动汽车已开始生产。马斯克还表示,特斯拉计划到2024年在Dojo上投入超过10亿美元。
9月6日——马斯克在X上发帖称,特斯拉受到AI训练计算能力的限制,但英伟达和Dojo将解决这个问题。他表示,管理特斯拉每天从其汽车获取的约1600亿帧视频数据极其困难。
2024年,扩大规模的计划
1月24日——在特斯拉第四季度及全年财报电话会议上,马斯克再次承认Dojo是一个高风险、高回报的项目。他还表示,特斯拉正在“走Nvidia和Dojo的双轨路线”,“Dojo正在发挥作用”,并且“正在开展训练工作”。他指出,特斯拉正在扩大Dojo的规模,并制定了“Dojo 1.5、Dojo 2、Dojo 3等一系列计划”。
1月26日——特斯拉宣布计划斥资5亿美元在布法罗建造一台Dojo超级计算机。马斯克随后淡化了这笔投资的重要性,他在X上发帖称,虽然5亿美元是一笔巨款,但“仅相当于英伟达的10k H100系统。特斯拉今年在英伟达硬件上的投入将超过这个数字。目前,在人工智能领域保持竞争力的门槛至少是每年数十亿美元。”
4 月 30 日——据 IEEE Spectrum 报道,在台积电的北美技术研讨会上,该公司表示 Dojo 的下一代训练模块 — — D2 已经投入生产,该模块将整个 Dojo 模块放在一块硅晶片上,而不是连接 25 块芯片来制作一块模块。
5 月 20 日——马斯克指出,Giga Texas 工厂扩建的后部将包括建造“超密集、水冷超级计算机集群”。
6月4日——CNBC报道称,马斯克将为特斯拉预留的数千块英伟达芯片转给了X和xAI。马斯克最初否认该报道不实,但在X上发帖称,由于德州超级工厂(Giga Texas)南扩建工程仍在继续,特斯拉没有地方发送这些英伟达芯片,“所以它们只能放在仓库里”。他指出,该扩建工程将“容纳5万辆用于全自动驾驶(FSD)训练的H100芯片”。
他还发帖称: “我之前说过,特斯拉今年将在人工智能方面投入约 100 亿美元,其中约一半用于内部支出,主要是特斯拉设计的人工智能推理计算机和所有车型的传感器,以及 Dojo。用于构建人工智能训练超级集群的 Nvidia 硬件约占总成本的三分之二。我目前对特斯拉今年收购 Nvidia 硬件的最佳预测是 30 亿至 40 亿美元。”
7月1日——马斯克在特斯拉X上透露,目前的特斯拉汽车可能没有合适的硬件来支持该公司的下一代AI模型。他表示,如果不升级车辆推理计算机,“下一代AI的参数数量增加约5倍”将“非常难以实现”。
NVIDIA 供应挑战
7 月 23 日——在特斯拉第二季度财报电话会议上,马斯克表示,对 Nvidia 硬件的需求“如此之高,以至于通常很难获得 GPU”。
“因此,我认为我们需要在 Dojo 上投入更多精力,以确保我们拥有所需的训练能力,”马斯克说道,“我们确实看到了 Dojo 能够与英伟达竞争的潜力。”
特斯拉投资者演示文稿中的一张图表预测,到2024年底,特斯拉的AI训练能力将从6月份的约4万个提升至约9万个H100 GPU。当天晚些时候,马斯克在X上发布消息称,Dojo 1“到年底将拥有约8000个H100 GPU的在线训练能力”。他还发布了这台超级计算机的照片,它似乎采用了与特斯拉Cybertruck相同的类似冰箱的不锈钢外壳。
从 Dojo 到 Cortex
7 月 30 日—— 马斯克在回复某人的帖子时表示,AI5 距离大规模生产还有大约 18 个月的时间,该帖子声称要成立一个“特斯拉 HW4/AI4 车主对 AI5 推出时落后感到愤怒”的俱乐部。
8 月 3 日——马斯克在 X 上发帖称,他参观了“Giga Texas(又名 Cortex)的特斯拉超级计算集群”。他指出,该集群将由大约 100,000 个 H100/H200 Nvidia GPU 组成,并“拥有用于 FSD 和 Optimus 视频训练的海量存储空间”。
8 月 26 日——马斯克在 X 上发布了Cortex 的视频,他将其称为“正在奥斯汀特斯拉总部建造的巨型新型 AI 训练超级集群,旨在解决现实世界的 AI 问题”。
2025 年 ,Dojo 不再更新
1月29日——特斯拉在2024年第四季度及全年财报电话会议上并未提及Dojo。不过,特斯拉在奥斯汀超级工厂的全新AI训练超级集群Cortex却亮相了。特斯拉在股东大会上指出,Cortex已完成部署,该集群由约5万块H100 Nvidia GPU组成。
信中写道:“Cortex 帮助实现了 FSD(监督式)的 V13,由于数据量增加了 4.2 倍、视频输入分辨率更高……以及其他增强功能,其安全性和舒适性得到了重大提升。”
在电话会议中,特斯拉首席财务官 Vaibhav Taneja 指出,特斯拉加快了 Cortex 的建设,以加速 FSD V13 的推出。他表示,包括基础设施在内的 AI 相关资本支出“迄今为止已累计约 50 亿美元”。Taneja 表示,他预计 2025 年 AI 相关资本支出将持平。
全部评论