678CHAT AI资讯 英伟达发布ConnectX-8超级网卡,AI训练延迟骤降60%

英伟达发布ConnectX-8超级网卡,AI训练延迟骤降60%

8月26日,科技巨头英伟达再次引领高性能计算潮流,正式发布专为Blackwell架构打造的ConnectX-8超级网卡。这款被官方称为“超越传统范畴”的网络设备,正式命名为SuperNIC,标志着AI基础设施在连接效率上的重大突破。

英伟达发布ConnectX-8超级网卡,AI训练延迟骤降60%插图

当前AI技术快速发展,训练和推理作为两大核心任务,对网络环境的需求截然不同。英伟达指出,AI训练通常是长时间、同步的高强度计算,对外部通信依赖较低;而推理任务更关注响应速度,呈现出高度分布式和极度延迟敏感的特点。如何在同一硬件平台上兼顾这两种不同负载,成为构建高效AI集群的关键挑战。

ConnectX-8正是为解决这一难题而生。它具备双模支持能力,可无缝对接Spectrum-X以太网和Quantum-X InfiniBand硅光交换技术。其底层硬件管线基于800G RDMA构建,内置智能负载均衡、精准拥塞控制和高可靠性传输机制,确保数据在GPU节点间高速稳定流动。

从规格来看,这款超级网卡堪称顶级配置:配备800Gb/s的InfiniBand XDR接口和双路400G Spectrum-X以太网接口,插槽采用PCIe Gen6 X48通道设计,并通过集成PCIe交换机实现更高带宽利用率。软件层面全面兼容Verbs、NCCL、NIXL及DOCA API,大幅提升了在各类AI框架中的适配性和开发效率。

值得一提的是其扩展能力——ConnectX-8支持构建高达64个GPU的大型集群。内置RDMA技术可扩展操作系统级服务,显著优化AI网络通信效率。尤为关键的是,网卡集成了算力达16T的RISC-V数据路径加速器。这一创新设计使实际运行中,相比传统商用现成(OTS)RDMA网卡与交换机组合:

训练步长延迟降低60%,尾部延迟几乎趋近于零

这为大规模模型训练提供了前所未有的流畅体验。

据悉,SuperNIC作为专为云环境中超大规模AI负载设计的新型网络加速器,正逐渐成为连接GPU算力孤岛的核心枢纽。ConnectX-8的发布,无疑为下一代AI数据中心树立了新的性能标杆。

本文来自网络,不代表678CHAT立场,转载请注明出处:https://www.678chat.com/ai/19157.html

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

返回顶部