当所有人都在盯着GPU算力时,真正卡脖子的可能是那根“看不见的网线”。昨天,国产方案给出了答案。
2026年3月12日,一个注定要被载入中国算力史的日子。

中科曙光正式发布首款全栈自研400G无损高速网络——scaleFabric。这不是又一款“国产替代”的常规产品,而是一次从底层IP到上层软件100%自主研发的技术突围。
中国工程院院士邬贺铨在发布会现场给出了极高评价:“scaleFabric是国内首款全栈自主研发的400G原生RDMA高速网络系统,性能对标国际主流,且经规模化实践验证,补齐了国产高速网络的短板。”

为什么一款网络产品能让院士如此重视?因为在大模型训练进入万卡乃至十万卡时代的今天,决定算力效率的关键,正从单卡性能转向集群网络互联。而这一领域,长期以来被英伟达的InfiniBand(IB)方案牢牢垄断。
今天锐少带你深度拆解:这条国产“算力大动脉”究竟强在哪里?它如何攻破英伟达的“隐形护城河”?
一、算力规模战背后的“隐形门槛”
在AI大模型训练中,数万块GPU需要频繁同步梯度数据,采用All-Reduce等通信模式。业内研究显示,在大规模分布式训练中,网络通信耗时占比已达到30-50%。在超大规模模型或采用复杂并行策略的场景,这一比例甚至高达50%至70%。
这意味着:再多的顶级GPU,如果网络不畅,也只能在等待中空转。
过去,国内用户只有两个选择:
一是进口IB网络,以英伟达为代表,性能卓越但价格高昂、供货周期不可控;
二是RoCE路线,即在以太网基础上嫁接RDMA技术。这一方案在中小规模组网中表现尚可,但随着集群迈入万卡时代,其带宽利用率、时延控制等短板逐渐暴露。更重要的是,其核心网卡芯片仍主要依赖国外厂商。
邬贺铨院士直言:“长期以来,高速高端网络市场被国外技术垄断,成为我国算力产业自主发展的核心瓶颈之一。”
二、技术路线:为什么必须走“最难但最对”的路?
scaleFabric最值得关注的一点,是其技术路线的选择。
当前高速网络主要有两条路径:一是InfiniBand原生路线,性能卓越但长期被国外垄断;二是RoCE路线,即在以太网基础上嫁接RDMA技术。
中科曙光直接选择了前者。为什么?
据中科曙光高速网络互联产品部总工程师万伟介绍,IB是为高端计算而生的专用网络,协议栈专为高速通信设计,交换机采用VCT交换模式,时延控制在300纳秒以内。而RoCE沿用以太网的“存储-转发”交换机制,数据包需完整接收后再转发,这使得其在时延控制方面与原生IB架构存在客观差异——行业内实测数据显示,RoCE在交换节点上的处理时延通常为IB方案的两倍以上。
更关键的是流控机制的底层差异。IB采用基于信用的流控机制,在数据传输前确认接收端资源充足,从根源上避免丢包。而RoCE依赖PFC机制进行拥塞管理,这是一种“发现问题再解决”的被动调控方式。随着集群规模扩张,PFC机制容易引发连锁反应,导致所谓的“PFC风暴”或死锁状态。
“对于万卡级大规模集群来说,这些差异直接决定了系统能否稳定运行。”中科曙光高级副总裁李斌说道:“因此在技术路线上,我们选择走最难但最对的路。”
三、性能对标:多项指标赶超英伟达NDR
说完了“为什么做”,我们来看“做得怎么样”。
此次发布的scaleFabric400系列网络产品,技术规格全面对标英伟达NDR,部分指标实现赶超:
网卡性能:
基于PCIe5.0接口,端口带宽达400Gbps
端到端通信时延低至0.9微秒
交换机性能:
单端口带宽达800Gbps
整机交换容量可达双向64Tbps
交换时延约260纳秒
支持800G×40或400G×80端口扩展
扩展能力:
与英伟达NDR相比,交换机端口密度提升25%
网卡最大QP数支持提升100%
单子网互连规模是传统IB的2.33倍
可支持最大11.4万卡集群部署
稳定性:
采用基于信用的无损流控机制,从根源规避拥塞丢包风险
链路故障恢复时间小于1毫秒
已支撑近万卡集群持续稳定运行验证超10个月
成本优势:
网络总成本较市面IB方案可降低30%
这一组数据意味着:在万卡级AI训练场景中,国产网络产品不仅“能用”,而且已经达到“好用、耐用”的水平。
四、落地验证:国家超算互联网的3万卡实战
技术创新最终要经得起实践检验。
scaleFabric并非纸上谈兵。今年初,国家超算互联网郑州核心节点悄然上线了一项关键部署:3套国产万卡级智算集群同步上线试运行,总规模达3万卡。而支撑这一国家级AI算力网络基座高效运转的核心,正是scaleFabric。

运行数据显示,该网络系统在大规模集群环境中保持稳定运行,可支持跨POD组网及大规模并行训练任务。已累计为超万名用户提供算力服务。
中科曙光高级副总裁李斌表示,随着产品在超大规模智算集群中的落地应用,国产原生RDMA技术路线正逐步走向成熟,围绕其形成的高性能网络产业生态也正在加速形成。
五、战略意义:补齐中国高端智算的最后一块拼图
如果把智算中心比作一个超大型计算工厂,GPU是生产线上的工人,那么高速网络就是连接他们的传送带。
“传送带不够快、不够稳,再多的工人也只能闲置等待。”李斌的这个比喻,精准道出了网络在算力体系中的核心地位。
过去很长一段时间里,这条“传送带”恰恰是我国智算体系建设中最薄弱的环节。从高速SerDes IP、核心芯片到IB网卡、IB交换机,InfiniBand相关产业链基本被海外厂商垄断。
scaleFabric的发布,意味着我国在智算互联这一关键环节开始形成自主技术路径。它实现了从核心关键IP、交换芯片、网卡到交换机、驱动与管理软件的全栈自研,构建起从硬件到软件的完整技术体系。
依托在高性能计算、存储与网络领域的长期技术积累,中科曙光已逐步形成 “算—存—网”协同发展的完整算力底座能力。这为我国大规模AI基础设施提供了系统级的自主支撑。
值得注意的是,在“光合组织”AI计算开放架构联合实验室下设的“数据中心网络优化项目组”,曙光正携手产业链上下游,推动自主网络标准制定与场景化方案研发。这意味着,scaleFabric的诞生不仅是单一产品的突破,更是国产高性能网络生态的起点。
结语
从芯片到网络,从硬件到软件,中国智算正在构建一个完整、自主、可持续的产业体系。
邬贺铨院士在发布会最后寄语:“当前人工智能全域普及,算力成为核心生产力,算力的竞争也升级为算、网、存协同的全生态的博弈。希望曙光公司以此为新起点,持续技术创新,深化产业协作,构建自主、先进、安全的高速网络技术和产品体系。”
当国产GPU不断突破算力天花板,当国产高速网络打通算力大动脉,中国智算的“最后一块拼图”正在补齐。在这场关乎国运的AI竞赛中,我们不仅要有自己的“大脑”,还要有自己的“神经”。
(《锐少产业分析》专栏将持续跟踪AI算力、未来产业等最前沿的投资机会,欢迎关注。)
以上内容仅代表个人观点,不作为股票推荐。
💡 温馨提示:本文内容仅为知识科普,不构成任何投资建议。市场有风险,投资需谨慎。
如果文章对您有启发,请点赞+收藏+转发给我鼓励,这是我持续分享的动力!
如果你有任何想沟通交流的内容,欢迎留言!让我们的投资越来越稳健!
👇关注我,把握更多市场机会!投资快人一步!
作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。