OpenAI 联合多家芯片与云厂商发布开放网络协议 MRC
okx 5月6日消息,OpenAI宣布与AMD、Broadcom、Intel、Microsoft、NVIDIA合作推出新型网络协议Multipath Reliable Connection(MRC),用于大规模AI训练集群GPU互联。MRC基于RoCE并扩展SRv6源路由,将单次数据传输拆分并“喷洒”到数百条路径上,显著降低核心拥塞,并在微秒级绕过链路和交换机故障。OpenAI在与OCI合作建设的Stargate超算及Microsoft Fairwater超算中已部署MRC,可用两层交换机连接逾10万块GPU,同时减少功耗和设备数量。MRC规范已通过Open Compute Project向业界开放。
