谷歌、AMD、国产超节点持续发力,打破英伟达独大格局

2026-03-03 18:48:103
东兴证券】投资摘要:





超节点与 Scale-up 网络是突破算力与通信瓶颈、支撑万亿级大模型与高实时性应用的关键基础设施。本篇超节点与 Scale up 网络行业深度报告,详细研究英伟达、谷歌、AMD 以及华为四家头部 AI 算力芯片厂商在此领域的布局进展以及各自优势。我们认为,超节点与 Scale-up 网络正处于快速发展期,并将成为算力芯片、网络部件(PCB 板、交换芯片、光器件、高速铜缆)、存储部件、供电和散热设施部件等新兴技术的重要应用市场。




(1)英伟达:超节点领先优势建立在 NVLink 和 NVLink Switch。





在超节点技术方案上,英伟达处于领先优势。2024-2025年,英伟达陆续推出GH200 NVL72、GB200/ GB300NVL72 等成熟超节点解决方案。根据大摩预测,2025 年英伟达 GB200/300 NVL72 出货量约 2800 台。展望 2026-2027 年,英伟达计划推出 Vera Rubin NVL144 和 Rubin Ultra NVL576。互联 GPU 数将从 72 颗进一步向 576 颗发展。届时,英伟达将发布新一代 Kyber 机架,架构引入 NVLink Switch Blade(NVLink 交换机刀片),通过 PCB 中板替代传统 5000+根有源铜缆。可以看到,Rubin Ultra NVL576 仍保持较强的工程创新能力。英伟达超节点的优势建立在 NVLink 和 NVLink Switch。为实现 AI 训练集群高带宽与低延迟数据传输,NVLink 重新设计通信架构,并引入一系列先进技术,包括网状拓扑、差分信号传输、流量调度信用机制、多Lane绑定技术、统一内存空间等。截止2025年,NVLink 5 Switch实现支持单GPU到GPU带宽1800GB/s,可构建 72 GPU 的 NVLink 域,总带宽达 130 TB/s(双向),支持 72 GPU 全互联通信。在后续计划中,NVSwitch Gen6 和 Gen7 的 GPU-to-GPU 通信带宽继续升级为 3.6TB/s。但另一方面,Scale up 网络兴起源于满足大模型分布式训练和推理中的张量并行(TP)与专家并行(EP)。目前 AI 产业也在探索降低 TP 与 EP 规模的技术方案,从而降低 Scale up 网络规模的上限。我们认为,Scaleup 网络的发展空间或限制英伟达在超节点领域的领先优势。为保持领先优势,实现 Scale up 网络和 Scaleout 网络融合或将成为英伟达超节点新的发展趋势。





(2)华为:对外开放灵衢互联协议,超节点性能追赶英伟达。





国内 Scale Up 协议尚未统一,华为灵衢协议尚未被国内业界广泛接受。在 Scale Up 协议方面,华为推出灵衢协议,并从 2.0 版本起转向开放标准。除此之外,国内其他厂商正探索多种互联协议,包括中移 OISA、腾讯 ETH-X、高通量以太网 ETH+以及中兴通讯 OLink 等。为打破生态壁垒,国内正积极推动标准统一,比如工信部正牵头推动 CLink 协议,旨在形成统一的国内标准。华为超节点依靠集群化方式实现性能追赶。Atlas 950 超节点预计 2026 年第四季度发布,相比英伟达同样将在 2026 年下半年上市的 NVL144 总算力 2.52 EFLOPS(FP8),其算力达到 8 EFLOPS(FP8)。此外,Atlas 950 超节点在内存容量 1152TB 与互联带宽 16.3PB/s,也实现大幅领先。我们认为,短期内,华为超节点依靠集群化实现性能追赶,但在超节点复杂性、可靠性、功耗等维度需要平衡。从整体解决方案看,英伟达在超节点的芯片工艺、软件生态与系统集成上的优势仍难以撼动。Atlas 950 超节点互联方案或将调整,显示华为超节点技术在标准化阶段仍需夯实。相比上一代超节点,华为 Atlas 950 超节点不再使用全光互联架构,其通过“柜内正交铜互联+柜间光互联”的混合设计,在机柜内部利用铜互联实现高可靠、低成本和低功耗的连接,跨机柜则通过光互联保障系统的可扩展性,从而在维持系统可扩展性的同时,有效控制总体拥有成本(TCO)。





(3)谷歌:建立光互联超节点,与英伟达形成不对称竞争。





谷歌 TPU 超节点建立成熟的光互联 Scale up 网络。从技术成熟度看,2023-2025 年谷歌陆续推出 TPU v4、TPU v5p、TPU v7 三代超节点,完成了技术路线探索和方案标准化。此外 TPU v7 也获得外部企业认可。2026 年,Anthropic 将直接从博通采购近 100 万颗 TPU v7 Ironwood AI 芯片,本地部署在其控制的数据中心。2027 年,谷歌将推出第 8 代 TPU,对标 Nvidia Vera Rubin。可以看到,届时谷歌 TPU 超节点的性能指标进一步优化提升。谷歌 TPU 超节点竞争优势建立在 OCS 交换机,技术路线独树一帜。相比英伟达、华为、AMD 等超节点厂商,谷歌是全球首个将光电路交换机(OCS)大规模商用部署于 Scale up 网络的企业,技术路线独树一帜。谷歌 OCS 交换机,涉及精密光学、机械工程与半导体工艺的深度交叉应用,在光互联领域构筑一道高壁垒的技术护城河。相较于电分组交换机,光电路交换技术具备诸多优势:光电路交换机可跨多代光收发模块技术复用、光电路交换机的每比特能耗较电分组交换机低数个数量级、光电路交换机引入的时延极小。OCS 交换机商用落地存在多重困难:光电路交换机需扩展至数百个端口以支撑足够数量 NPU 互连;受限于光电路交换机的控制软件和反射镜配置时延,商用光电路交换机的交换时延通常为 10~20 毫秒;为降低链路功率,光电路交换机插入损需要控制在理想水平。为搭建高性价比、大规模的光交换层,谷歌创新研发三大核心硬件组件:光电路交换机、波分复用光收发模块和光环形器。其中谷歌 Palomar 光电路交换机的光学核心模块是实现光转向功能的 MEMS 微反射镜;波分复用光收发模块是提升布线效率、支撑大规模且持续扩张数据中心的关键;光环形器是实现光电路交换机链路双向通信的核心器件,将所需的光电路交换机端口和光纤数量减半。





(4)AMD:UALink 成为重要开放标准,超节点有望成为英伟达有力竞品。





作为 Scale up 网络开放技术路线方,UALink 成为重要标准。2025 年 1.0 版本规范正式发布;2026 年,UALink 2.0 版本有望发布。我们认为,目前 UALink 正处于从标准制定阶段走向产品落地阶段,预计 UALink生态将在 2027 年迎来突破发展,被众多数据中心接纳。目前 UALink 联盟受到业内广泛支持,截止 2026年 1 月底,成员单位超过 100 家,将成为英伟达 NVLink 有利挑战方。AMD 超节点 Helios 机架有望成为行业主流选择。Helios 机架采用双宽机架设计,宽度从 1 个机架提升到 2个机架,在复杂性、可靠性和性能间实现良好平衡。从算力、内存、互联带宽等指标,MI455x 系列 Helios机柜是目前业界最能挑战英伟达的 NVL72 机柜的竞品;而在功耗领域,对比 GB200 NVL72 机柜,Helios机架优势显著。此外,双宽结构为未来升级预留物理空间,例如可扩展至 144GPU 配置,而无需重新设计机架基础设施。

投资策略:





自2025年开始,超节点成为 AI 算力网络重要的技术创新方向。从 AI 基建竞争维度,AI 芯片厂商从芯片算力性能竞争延续至芯片+Scale up 网络的双战场。因此,除了原先英伟达、华为、AMD 以及谷歌等芯片公司,全球更多厂商加入超节点赛道的竞争,包括微软、Meta、Amazon、中国移动、阿里巴巴、字节跳动、腾讯、百度、中科曙光中兴通讯浪潮信息紫光股份(新华三)、海光信息沐曦股份恒为科技等。





全球超节点竞争格局尚未确立。英伟达目前处于领先地位,但谷歌、AMD、华为等巨头在超节点领域的持续发力已经对英伟达一家独大的格局构成挑战。从股价表现看,2023-2024 年,英伟达股价大幅跑赢谷歌、AMD 以及 A 股中证算力指数。但在 2025 年,英伟达股价累计涨幅 38%,显著落后于谷歌、AMD 以及 A股中证算力指数。我们认为,在超节点技术发展中,市场将继续对谷歌、AMD 以及国产超节点板块价值重估。





投资建议:(1)看好谷歌、AMD 以及国内超节点厂商;(2)看好英伟达、谷歌与 AMD 超节点供应链,包括 PCB 背板、高速铜缆、光模块、供电与液冷系统等;(3)基于交换机及芯片是 Scale up 网络互联的关键设备,看好谷歌光路交换机(OCS)核心零部件供应商以及 UALink 标准下的交换机芯片研发商。

注:内容来自网络,未经核实,不构成任何投资建议,请谨慎参考!如有侵权,请私信联系删除!欢迎各位老师点赞、评论、转发,谢谢!

作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。

合规声明:本站发布的所有文章及观点均系个人研究共享,投资心得交流,不代表本站立场,且不构成任何形式的投资建议。投资者据此操作,风险自担,请务必保持独立审慎的决策态度。