近日,京东云旗下JoyBuilder模型开发平台完成了一次里程碑式的升级,成功支撑全球领先的具身智能模型GR00T N1.5实现千卡规模的高效训练。

此次升级不仅让JoyBuilder成为业内首个全面兼容LeRobot开源训练框架、并支持千卡级具身智能训练的AI开发平台,更在训练效率上取得突破性进展——相较社区开源版本,整体训练速度提升高达3.5倍。依托软硬件协同优化与算法层面的深度创新,平台将原本耗时15小时的亿级数据千卡训练任务压缩至仅22分钟,极大加快了具身智能技术从实验室走向产业应用的步伐。
为达成这一性能飞跃,京东云AI Infra团队对JoyBuilder平台实施了覆盖数据、计算到通信的全栈式优化。在数据处理链路方面,团队重构了具身智能场景下的预处理与加载机制,通过CPU与GPU的异步流水线设计,显著降低计算单元空闲等待时间;面对具身智能任务中普遍存在的海量小文件挑战,自研的云海JPFS高性能并行文件系统凭借分布式元数据架构与智能预取策略,在1024卡集群环境中实现了超过400GB/s的持续读取带宽,确保训练数据源源不断、高速供给。
在模型计算层面,团队聚焦VLA(视觉-语言-动作)架构的典型计算瓶颈,对Attention机制、Token动态裁剪及训练后量化等关键模块进行精细化调优,大幅提升单卡算力利用率。同时,在底层基础设施上,平台部署了3.2Tbps的RDMA高速网络,并融合多轨道通信优化、拓扑感知任务调度与智能震荡抑制技术,有效保障千卡集群在长时间训练中的通信高吞吐与低延迟。此外,基于云原生理念构建的AI数据湖进一步优化了端到端的数据调度与训练流水线,实现从原始数据到模型输出的无缝衔接。
得益于上述全链路协同优化,JoyBuilder现已全面支持LeRobot训练框架的最新数据协议,不仅夯实了其在具身智能开发平台领域的技术护城河,也为行业提供了可复用、可扩展的高效训练范式,推动具身智能加速迈入规模化落地新阶段。
