«

马斯克“疯狂”之举:xAI 购海外电厂搬回美国,欲解决AI数据中心高耗电顽疾

一把老骨头 发布于 阅读:8 科技新闻


近日,半导体分析公司 SemiAnalysis 的迪伦·帕特尔在播客中透露,埃隆·马斯克旗下 xAI 的新数据中心计划容纳数百万个 AI 芯片,耗电量惊人。为解决供电难题,马斯克竟打算购买一座海外发电厂并运往美国,且随后他在推特上证实了这一消息。

目前,马斯克的 xAI 巨像 AI 超级计算机已是全球顶尖的耗电大户,它配备了约 20 万个英伟达 Hopper GPU,耗电量高达 300 兆瓦左右。在为其供电过程中,xAI 已经面临诸多挑战。该数据中心位于田纳西州孟菲斯附近,为保障运行,xAI 安装了 35 台燃气轮机,可产生 420 兆瓦电力,还部署了特斯拉 Megapack 系统来平衡电力需求。

然而,随着公司发展,挑战愈发严峻。xAI 下一个 AI 数据中心预计将容纳 100 万个 AI GPU,耗电量可能与 190 万户家庭相当。这 100 万个英伟达 Blackwell GPU 的耗电量,根据加速卡型号和配置不同,将在 1000 兆瓦至 1400 兆瓦之间。而且,电力系统的负载不止 GPU,CPU、DDR5 内存、存储、网络设备、冷却、空调、电源效率以及照明等因素都会增加耗电量。在大型 AI 集群中,通常要在 AI GPU 耗电量基础上,额外增加 30% 至 50% 的开销(用 PUE 表示)。所以,配备 100 万个 GPU 的数据中心,耗电量可能在 1400 兆瓦至 1960 兆瓦之间(假设 PUE 为 1.4)。

为如此庞大的计算负载供电,单一的大型太阳能发电厂不可行,它需要数吉瓦的太阳能板和庞大的电池储能系统,成本高且占地大。核反应堆虽能以较少机组满足需求且无直接碳排放,但设计和建设时间长达 10 年,马斯克不太可能选择。相对而言,建设多个天然气联合循环燃气轮机(CCGT)电厂更实用,每个电厂产能在 0.5 兆瓦至 1500 兆瓦之间,部署相对较快,可分阶段扩展,也更容易与现有电网集成,这或许是 xAI 的选择。

实际上,任何进行 1.4 至 1.96 吉瓦部署的组织都会成为主要工业能源买家。目前 xAI 的巨像是现场发电并从电网购电,新数据中心很可能也会结合专用现场电厂与电网连接。由于在美国收购发电厂耗时较长,xAI 选择购买海外发电厂并运往美国,这凸显了 AI 开发对大规模能源供应的迫切需求。

除了供电挑战,xAI 还在迅速扩张。它在孟菲斯购买了一家工厂,正在改造成额外的数据中心空间,该空间可为约 12.5 万个八路 GPU 服务器及配套硬件供电。

迪伦·帕特尔称,xAI 已集结庞大计算资源和优秀研究团队推进 Grok AI 模型研发,但更大挑战还在后面。大多数领先 AI 公司都在集中庞大计算集群、聘请顶尖人才、训练更大规模 AI 模型。若 xAI 想在竞争中领先,就必须建设更先进、更耗电的数据中心。

AI 数据中心 马斯克 xAI