埃隆·马斯克在个人社交平台再度以一句简洁宣告掀起波澜:“Grok 背后的 Colossus 2 超算集群现已全面投入运行。”这不仅是一次技术发布,更标志着全球首个单体算力突破吉瓦(GW)门槛的AI训练系统正式落地,开启了高密度计算的新纪元。
这一硅基“巨兽”的持续功耗高达1吉瓦,已超越美国旧金山市的历史用电峰值。其能源需求堪比一座大型火力发电厂或重工业基地,足见其在物理世界中的真实重量。而据马斯克透露,这并非终点——今年4月,Colossus 2 将进一步扩容至1.5吉瓦,继续拉高AI基础设施的能耗基准线。
从破土动工到全负荷运转,整个项目周期仅用了一年半时间。其算力等效于140万块英伟达H100 GPU,并采用全液冷架构以应对极端热密度。更令人震惊的是,xAI仅用六个月便完成了这一估值超数百亿美元的工程部署,执行力之强在科技史上亦属罕见。
与OpenAI依托微软Azure、Anthropic依赖亚马逊AWS不同,xAI选择了彻底垂直整合的道路:从电力供应、冷却系统到芯片互联,全部自主设计、自主建设。这种“从零开始”的模式,使其摆脱了传统云服务架构的束缚,能够为超大规模AI训练量身打造最优物理环境。
在Colossus 2园区的卫星影像中,一幢建筑屋顶赫然喷涂着“MacroHard”字样——这是典型的马斯克式讽刺,既是对传统软件帝国的挑衅,也昭示其重塑全球科技格局的野心。他曾公开表示,软件公司本质上可被AI完全模拟与替代,未来真正的竞争壁垒在于底层硬件与能源控制权。
他的目标极为激进:五年内,xAI的总算力将超越全球所有其他公司的总和。具体而言,公司将部署相当于5000万个H100级别GPU的计算资源。即便采用更先进的制程与架构,如此规模仍需消耗近5吉瓦电力,相当于数十座核电站的稳定输出。
目前,xAI已在全球部署逾45万块AI加速GPU,并计划于2026年第二季度将其翻倍至90万块。这笔累计超300亿美元的硬件投资,使其在AI物理基础设施层面遥遥领先同行。
然而,这场算力远征正面临现实世界的强力制约。2026年1月,美国环保署裁定,xAI在孟菲斯基地未经许可启用天然气涡轮机组供电,违反空气质量法规。监管机构明确驳回其“临时豁免”申请,凸显出高科技扩张与公共治理之间的深层冲突。
电力瓶颈更为严峻。即便未来GPU能效提升十倍,一个50 ExaFLOPS级别的集群仍需接近4.7吉瓦的持续供电。这意味着,未来的AI竞赛胜负手,或许不再局限于算法或数据,而是谁能率先拿下电网接入权、土地批文与排放配额。
在行业对比图中,xAI的算力曲线已呈现近乎垂直的增长态势。当竞争对手尚在规划2027年的千卡级集群时,xAI已将万卡、百万卡集群变为现实。这场以硅、铜、水和电构筑的战争,正在重新定义人工智能的时代边界。
