【锐少产业分析】“补齐中国高端智算最后一块拼图”！国产首款400G原生RDMA问世，英伟达

2026-03-13 07:06:406℃

当所有人都在盯着GPU算力时，真正卡脖子的可能是那根“看不见的网线”。昨天，国产方案给出了答案。

2026年3月12日，一个注定要被载入中国算力史的日子。

中科曙光正式发布首款全栈自研400G无损高速网络——scaleFabric。这不是又一款“国产替代”的常规产品，而是一次从底层IP到上层软件100%自主研发的技术突围。

中国工程院院士邬贺铨在发布会现场给出了极高评价：“scaleFabric是国内首款全栈自主研发的400G原生RDMA高速网络系统，性能对标国际主流，且经规模化实践验证，补齐了国产高速网络的短板。”

为什么一款网络产品能让院士如此重视？因为在大模型训练进入万卡乃至十万卡时代的今天，决定算力效率的关键，正从单卡性能转向集群网络互联。而这一领域，长期以来被英伟达的InfiniBand（IB）方案牢牢垄断。

今天锐少带你深度拆解：这条国产“算力大动脉”究竟强在哪里？它如何攻破英伟达的“隐形护城河”？

一、算力规模战背后的“隐形门槛”

在AI大模型训练中，数万块GPU需要频繁同步梯度数据，采用All-Reduce等通信模式。业内研究显示，在大规模分布式训练中，网络通信耗时占比已达到30-50%。在超大规模模型或采用复杂并行策略的场景，这一比例甚至高达50%至70%。

这意味着：再多的顶级GPU，如果网络不畅，也只能在等待中空转。

过去，国内用户只有两个选择：

一是进口IB网络，以英伟达为代表，性能卓越但价格高昂、供货周期不可控；

二是RoCE路线，即在以太网基础上嫁接RDMA技术。这一方案在中小规模组网中表现尚可，但随着集群迈入万卡时代，其带宽利用率、时延控制等短板逐渐暴露。更重要的是，其核心网卡芯片仍主要依赖国外厂商。

邬贺铨院士直言：“长期以来，高速高端网络市场被国外技术垄断，成为我国算力产业自主发展的核心瓶颈之一。”

二、技术路线：为什么必须走“最难但最对”的路？

scaleFabric最值得关注的一点，是其技术路线的选择。

当前高速网络主要有两条路径：一是InfiniBand原生路线，性能卓越但长期被国外垄断；二是RoCE路线，即在以太网基础上嫁接RDMA技术。

中科曙光直接选择了前者。为什么？

据中科曙光高速网络互联产品部总工程师万伟介绍，IB是为高端计算而生的专用网络，协议栈专为高速通信设计，交换机采用VCT交换模式，时延控制在300纳秒以内。而RoCE沿用以太网的“存储-转发”交换机制，数据包需完整接收后再转发，这使得其在时延控制方面与原生IB架构存在客观差异——行业内实测数据显示，RoCE在交换节点上的处理时延通常为IB方案的两倍以上。

更关键的是流控机制的底层差异。IB采用基于信用的流控机制，在数据传输前确认接收端资源充足，从根源上避免丢包。而RoCE依赖PFC机制进行拥塞管理，这是一种“发现问题再解决”的被动调控方式。随着集群规模扩张，PFC机制容易引发连锁反应，导致所谓的“PFC风暴”或死锁状态。

“对于万卡级大规模集群来说，这些差异直接决定了系统能否稳定运行。”中科曙光高级副总裁李斌说道：“因此在技术路线上，我们选择走最难但最对的路。”

三、性能对标：多项指标赶超英伟达NDR

说完了“为什么做”，我们来看“做得怎么样”。

此次发布的scaleFabric400系列网络产品，技术规格全面对标英伟达NDR，部分指标实现赶超：

网卡性能：

基于PCIe5.0接口，端口带宽达400Gbps

端到端通信时延低至0.9微秒

交换机性能：

单端口带宽达800Gbps

整机交换容量可达双向64Tbps

交换时延约260纳秒

支持800G×40或400G×80端口扩展

扩展能力：

与英伟达NDR相比，交换机端口密度提升25%

网卡最大QP数支持提升100%

单子网互连规模是传统IB的2.33倍

可支持最大11.4万卡集群部署

稳定性：

采用基于信用的无损流控机制，从根源规避拥塞丢包风险

链路故障恢复时间小于1毫秒

已支撑近万卡集群持续稳定运行验证超10个月

成本优势：

网络总成本较市面IB方案可降低30%

这一组数据意味着：在万卡级AI训练场景中，国产网络产品不仅“能用”，而且已经达到“好用、耐用”的水平。

四、落地验证：国家超算互联网的3万卡实战

技术创新最终要经得起实践检验。

scaleFabric并非纸上谈兵。今年初，国家超算互联网郑州核心节点悄然上线了一项关键部署：3套国产万卡级智算集群同步上线试运行，总规模达3万卡。而支撑这一国家级AI算力网络基座高效运转的核心，正是scaleFabric。

运行数据显示，该网络系统在大规模集群环境中保持稳定运行，可支持跨POD组网及大规模并行训练任务。已累计为超万名用户提供算力服务。

中科曙光高级副总裁李斌表示，随着产品在超大规模智算集群中的落地应用，国产原生RDMA技术路线正逐步走向成熟，围绕其形成的高性能网络产业生态也正在加速形成。

五、战略意义：补齐中国高端智算的最后一块拼图

如果把智算中心比作一个超大型计算工厂，GPU是生产线上的工人，那么高速网络就是连接他们的传送带。

“传送带不够快、不够稳，再多的工人也只能闲置等待。”李斌的这个比喻，精准道出了网络在算力体系中的核心地位。

过去很长一段时间里，这条“传送带”恰恰是我国智算体系建设中最薄弱的环节。从高速SerDes IP、核心芯片到IB网卡、IB交换机，InfiniBand相关产业链基本被海外厂商垄断。

scaleFabric的发布，意味着我国在智算互联这一关键环节开始形成自主技术路径。它实现了从核心关键IP、交换芯片、网卡到交换机、驱动与管理软件的全栈自研，构建起从硬件到软件的完整技术体系。

依托在高性能计算、存储与网络领域的长期技术积累，中科曙光已逐步形成 “算—存—网”协同发展的完整算力底座能力。这为我国大规模AI基础设施提供了系统级的自主支撑。

值得注意的是，在“光合组织”AI计算开放架构联合实验室下设的“数据中心网络优化项目组”，曙光正携手产业链上下游，推动自主网络标准制定与场景化方案研发。这意味着，scaleFabric的诞生不仅是单一产品的突破，更是国产高性能网络生态的起点。

结语

从芯片到网络，从硬件到软件，中国智算正在构建一个完整、自主、可持续的产业体系。

邬贺铨院士在发布会最后寄语：“当前人工智能全域普及，算力成为核心生产力，算力的竞争也升级为算、网、存协同的全生态的博弈。希望曙光公司以此为新起点，持续技术创新，深化产业协作，构建自主、先进、安全的高速网络技术和产品体系。”

当国产GPU不断突破算力天花板，当国产高速网络打通算力大动脉，中国智算的“最后一块拼图”正在补齐。在这场关乎国运的AI竞赛中，我们不仅要有自己的“大脑”，还要有自己的“神经”。

（《锐少产业分析》专栏将持续跟踪AI算力、未来产业等最前沿的投资机会，欢迎关注。）

以上内容仅代表个人观点，不作为股票推荐。

💡 温馨提示：本文内容仅为知识科普，不构成任何投资建议。市场有风险，投资需谨慎。

如果文章对您有启发，请点赞+收藏+转发给我鼓励，这是我持续分享的动力！

如果你有任何想沟通交流的内容，欢迎留言！让我们的投资越来越稳健！

👇关注我，把握更多市场机会！投资快人一步！

作者声明：本文转载自第三方，旨在提供资讯参考，并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日，作者与文中提及的标的不存在持仓关系。

标签: 互联网人工智能数据中心芯片英伟达

合规声明：本站发布的所有文章及观点均系个人研究共享，投资心得交流，不代表本站立场，且不构成任何形式的投资建议。投资者据此操作，风险自担，请务必保持独立审慎的决策态度。

本文链接：https://www.sanhuba.cn/post/20-41-5403.html

上一篇万亿SAF风口炸场！中国生物航煤之王，垄断级产能+全球订单，

下一篇历史6轮油价上行周期对当下交易的启示

【锐少产业分析】“补齐中国高端智算最后一块拼图”！国产首款400G原生RDMA问世，英伟达

互联网相关

栏目分类

人工智能相关

数据中心相关

用户须知

【锐少产业分析】“补齐中国高端智算最后一块拼图”！国产首款400G原生RDMA问世，英伟达

 互联网相关

 栏目分类

 人工智能相关

 数据中心相关

用户须知

互联网相关

栏目分类

人工智能相关

数据中心相关

用户须知