SpaceX正在使用C语言编写的全新堆栈训练新模型,不再依赖JAX。马斯克确认Grok 5已经采用了这个新堆栈,并表示这种新堆栈能让大模型训练速度提升一个数量级。下一步,推理部分的堆栈也会用C语言重写。

马斯克在社交媒体上提到,他发布这一消息是为了鼓励那些希望从硬件中获得卓越性能的人加入SpaceX。他还提到Colossus II也可能出租。

SpaceX不仅在软件层面提高效率,在硬件端也大力投入。公司正在建造代号为Colossus II的下一代超算集群,总功率达到1吉瓦,造价约170亿美元。相比之下,xAI当初建Colossus I花费了30到40亿美元,Colossus II的规模直接跃升了一个量级。

随着算力扩张,SpaceX也在考虑如何将这些算力变现。最新公开的招股书中,AI基础设施被明确列为公司重要业务板块,与火箭发射并列。马斯克透露,SpaceX正在与其他公司洽谈类似的算力租赁合作,轨道数据中心也在规划中。





