AI算力产业链深度拆解②之中游篇

2026-05-19 22:06:4911

本文为「AI算力产业链深度拆解」系列第二篇。全系列共三篇,分别拆解上游(造出来)、中游(搭起来)、下游(用起来)。本文聚焦中游,从一颗芯片到万卡集群,看清谁在英伟达的光环之外,筑起了另一道护城河。

上游把芯片造出来了。但一颗B200离开台积电封装厂的那一刻,它离"能用"还很远。

一颗B200每秒20 petaflops算力,人类半导体工业的巅峰之作。但它单独什么也做不了,需要7个同伴组成一台8卡服务器,连到其他几千台服务器,共享一个"神经系统"来同步每一次梯度计算。电力系统供给兆瓦级能量,散热系统带走等于8台吹风机满功率的热量。任何一个环节掉链子,几十亿建起的算力集群利用率可能不到60%。一个万卡集群从硬件安装到软件调通,平均耗时3到6个月。

三组数字感受一下规模:

B200单卡功耗1000W。一台8卡服务器,仅GPU供电就是8000W。一个机柜42台这样的服务器,配电系统要扛超过300千瓦。

一个万卡集群,仅GPU和配套基础设施的电费,一天约50万度,相当于一个20万人小镇的居民日用电量,一年电费超过1.8亿人民币。

建一个万卡集群的硬件成本,在25到35亿人民币之间,还没算土地、基建和制冷系统。大致等于北京市中心一栋甲级写字楼的价格。

搭个服务器而已,能有多难?这是整个AI产业链上最昂贵的误解。上游是"造不造得出来"的生死题,中游是"搭不搭得起来"的工程题。前者听着更性感,后者其实更烧钱,烧完钱之后没有退路,选的供应商、定的技术路线一旦锁定,切换代价大到没人敢换。

从一颗芯片到万卡集群,隔着八道工程天堑。每一道天堑旁边,都站着一批寡头。它们不如英伟达耀眼。但它们的护城河来自同一个源头:规模诅咒。每上一个数量级,物理定律就砸一堵新墙。翻过墙的公司,得到的回报是没人敢换它。

上游的护城河是"别人追不上"。中游的护城河是"别人不敢换"。两种护城河一样深。但中游的寡头,更隐形。

这一篇,我们从一颗芯片出发,一层一层往上搭,看清整个中游的地图。

八层结构:①AI服务器,藏着最值钱的私有协议NVLink;②高速互联,速率翻倍就洗牌;③光模块与CPO,中国最强,也最易被偷家;④网络交换,万卡集群不掉链子靠交换芯片;⑤供电体系,单机柜功率从15kW飙到300kW;⑥散热体系,液冷从可选变必选;⑦数据中心,重资产、慢回报的隐形壁垒;⑧算力平台,硬件搭好,卖出去才是本事。

八层天堑,我们一层一层拆解。

第①层:AI服务器与GPU互联——英伟达最深的护城河,藏在一条私有高速公路里

提到英伟达的护城河,大多数人的第一反应是CUDA。

CUDA确实深。几百万AI工程师习惯了它的编程模型,换平台等于重新学一门语言。软件生态的粘性,是最强的一种锁定。

但CUDA不是最深的。

NVLink才是。

NVLink是英伟达自研的GPU-to-GPU互联协议。它解决的问题极其具体:8颗GPU装进一台服务器,它们之间怎么通信?

用标准PCIe?一台8卡服务器走PCIe 5.0,GPU间传数据的延迟是微秒级,带宽128GB/s。听着不慢。但对于大模型训练来说,每一次前向和反向传播,8颗GPU都在疯狂交换梯度数据。微秒级延迟意味着60%的计算时间浪费在等待上。

NVLink干了一件简单粗暴的事:甩开PCIe这条"公共马路",给GPU之间修了一条"私家高速公路"。当前第五代NVLink,单链路双向带宽900GB/s。8颗B200 GPU通过4颗NVSwitch芯片做全互联,任意两颗GPU之间的有效带宽达到1.8TB/s。下一代Blackwell Ultra平台,NVLink 6把这个数字推到3.6TB/s。

比PCIe 5.0快了一个数量级。这不是改进,是代差。

NVLink-NVSwitch体系是英伟达独家技术。全球没有第二家公司有同等级量产产品。华为UB-Mesh(基于HCCS总线)是国内最接近的追赶者,号称10Tbps带宽、150ns延迟,但生态成熟度和量产规模上,至少隔着一代。

这为什么是护城河?

因为NVLink制造了一个"要么全用英伟达,要么全不用"的锁定效应。你想搭一台8卡AI服务器,GPU得买英伟达的。你想让这8颗GPU高效工作,互联方案也必须是英伟达的。NVSwitch芯片、NVLink桥接器、配套PCB走线和固件,一整套封闭体系。你没法混搭:买4颗英伟达GPU配4颗国产GPU,然后通过开放总线通信。不行。

这种锁定从服务器级一路延伸到机柜级。

GB300 NVL72是英伟达最新的"超级Pod"形态。72颗Blackwell Ultra GPU通过NVLink Switch全连到一个机柜里,组成逻辑上的一颗"巨型GPU"。72颗GPU共享同一个内存地址空间。编程模型上,它就是一颗芯片。

一台GB300 NVL72机柜,仅GPU和NVLink互联系统的物料成本就逼近3000万人民币。北京一套房。

谁在为英伟达搭服务器?

GPU是英伟达设计的。NVLink是英伟达设计的。但把GPU、NVSwitch、内存、电源、散热器集成到一台物理服务器里这个活,英伟达不自己干。

它提供MGX参考设计(一种模块化服务器架构),ODM厂商照着设计做工程实现、供应链管理和大规模制造交付。

这个环节全球最大的玩家是工业富联(601138)。

工业富联是鸿海(富士康)旗下的云计算设备制造平台。它的AI服务器营收过去一年增长了超过3倍。FY2025全年,工业富联营收9029亿人民币,同比增长48.2%。云计算业务(含AI服务器)营收6027亿,同比增长88.7%,占总收入的三分之二。归母净利353亿,同比增长52%。2026年一季度,AI GPU机柜出货量同比增长3.8倍,势头未减。

什么概念?全球每出货一批AI服务器,相当一部分贴着工业富联的制造标签。英伟达、亚马逊、微软、Google,它们的AI服务器机箱上印着Foxconn Industrial Internet。

ODM模式的壁垒在哪?规模。年产几十万台服务器的供应链管理能力、品质一致性、全球交付网络,不是投钱就能短期复制的。一个万卡集群的交期错过一个月,客户损失以亿计。谁敢换一个没经过大规模验证的供应商?

国内另一个重要角色是浪潮信息(000977)。它是国产AI服务器的主力,尤其在信创和运营商市场。基于昇腾、海光等国产芯片的AI服务器,浪潮是最大的系统集成商之一。

BMC:服务器里那颗最重要的隐形芯片

BMC是基板管理控制器,服务器的"独立监护人",有自己的供电和网口。主CPU宕机了,BMC还在运行,远程开关机、监控温度电压、推送告警。数据中心运维管理几万台服务器,靠的就是BMC。

全球BMC市场,台湾信骅科技(Aspeed)市占率超70%,第二名新唐科技约15%,两家合计超85%。国内华为海思的BMC主要用于自研服务器,国民技术(300077)在信创BMC上有布局,国产替代刚起步。

第②层:高速互联介质——铜退光进,速率每翻一倍就洗一次牌

第①层的NVLink是服务器内部的私有高速公路。第②层是服务器之间、机柜之间的公共交通网。

这个网络有一个核心矛盾:速率每翻一倍,传输介质就重新洗牌一次。

背后的物理原理很简单。电信号在铜线里跑,距离越长,高频成分衰减越狠。800G时代,铜缆还能守住3米以内的机柜内互联。1.6T时代,铜的有效距离缩到1米以内。到了3.2T和CPO时代,光必须直接贴到芯片封装旁边。电信号的物理极限到了。

这是光不断逼近芯片、铜不断后退的持久战。铜不会消失。但铜的领地每一代都在收缩。

铜缆的逆向繁荣

传统服务器内部铜缆用量0.5到1公斤。AI服务器是另一个物种,8颗GPU全互联,GPU到NVSwitch、网卡、电源、风扇全是高密度线束,一台8卡AI服务器铜缆用量4到8公斤,传统服务器的7到8倍。铜缆整体市场在萎缩,但AI服务器的铜缆用量在爆发,一个缩小的市场里长出了暴增的细分。铜退光进不是铜缆的末日,是介质切换驱动的增量窗口。

具体产品分三类:

DAC,无源直连铜缆。纯铜线,无信号处理芯片。最便宜,距离最短,一般0.5到3米。机柜内GPU到交换机的主力方案。

ACC,有源铜缆。铜线加模拟信号均衡芯片。比DAC多跑一段距离,成本居中。

AEC,有源电缆。铜线加完整Retimer芯片。距离最长,成本最高。跨机柜短距互联用。

全球DAC/ACC/AEC高速铜缆市场,安费诺(Amphenol)、莫仕(Molex)、泰科(TE Connectivity)三家合计约79%份额。

A股中,立讯精密(002475)的224G铜缆已量产。这是目前全球最高速率等级,能支撑1.6T端口。兆龙互连(300913)在高速DAC领域也有布局。

连接器:国产替代在门缝里

224G信号通过一个连接器接口,对阻抗匹配、串扰抑制、机械精度的要求到了变态级别。引脚间距0.5mm,内部屏蔽结构加工公差微米级,不是"插头插座",是精密机电一体化产品。全球高速背板连接器市场安费诺一家独大,与英伟达深度绑定。瑞可达(688800)在56G/112G连接器上已批量供货,鼎通精密(688668)在高速I/O连接器壳体上有积累。国产替代的窗在开,但刚起步。

高速PCB和覆铜板:一块板子的材料决定了信号能跑多远

NVLink的信号在PCB上跑。224G信号过一张印刷电路板,对板材的要求高到了另一个级别。

普通服务器PCB用FR-4或Mid-Loss级别材料。AI服务器必须用M7或M8级超低损耗覆铜板。M7/M8的高频介电损耗比FR-4低一个数量级。只有用这种材料,224G信号跑十几厘米之后眼图还睁着。

M7/M8覆铜板全球由松下电工(Megtron系列)和台光电主导。A股中,沪电股份(002463)和深南电路(002916)在AI服务器高速PCB上取得重要突破。深南电路14层以下高速板已量产,16层已送样英伟达验证。

中国是全球最大PCB制造国。但M7/M8级覆铜板的上游原材料(超低损耗树脂),国产化率仍然不高。材料端的突破,比PCB制造本身更需要时间。

Retimer:信号会"坏在路上"

224G PAM4信号经铜缆或PCB长距离传输后,质量严重劣化。误码率从10⁻¹⁵掉到10⁻⁹,整个万卡集群每小时产生数十万次数据重传。训练效率断崖式下降。

所以需要Retimer或Redriver芯片在信号中途做修复。

Redriver是模拟方案:放大加均衡,成本低但能力有限。Retimer是数字方案:完整提取时钟再重新发送,成本高但效果好。224G时代,Retimer是主流。

全球PCIe/CXL Retimer市场,Astera Labs以约86%的份额一骑绝尘。A股中,澜起科技(688008)的PCIe 5.0 Retimer已量产出货,全球市占率约10.9%,排名第二。这是国产芯片在高速互联领域少数站上全球牌桌的案例。

高速互联是中游变化最快、格局最不稳定的环节。每一次介质切换,都意味着上一批公司的技术护城河被绕过去、下一批公司崛起。这不是"强者恒强"的赛道,是"快者生存"的赛道。切换就是洗牌,洗牌就是机会。中国公司在铜缆和PCB上已有确定竞争力,连接器和Retimer在追赶,差距正在肉眼可见地缩小。

第③层:光模块/CPO——组装胜利,还是技术胜利?

第②层讲的是铜。铜跑不远,超过3米就得换光。这件事中国公司做到了全球第一。

三组数字。中际旭创(300308)FY2025营收382亿人民币,同比增长60.3%;净利润108亿,同比增长108.8%。800G光模块全球出货份额40-50%,稳居第一。新易盛(300502)和天孚通信(300394)紧随其后。全球绝大多数AI GPU集群里插着的光模块,标签上写着中国公司的名字。

单看这三组数字,我们会觉得这是中国半导体最漂亮的一张出海成绩单。

但把一张800G光模块的BOM表拆开,故事就变了。

一颗800G光模块,DSP数字信号处理芯片占成本30%以上。光芯片(EML激光器或CW激光器)再占25%以上。光模块厂商自己的制造成本和毛利加在一起,只有20-30%。中际旭创已经是全球第一大光模块公司了,它的综合毛利率约31%。不低,但我们要知道它卖一个800G光模块收1000多美元,其中超过550美元是付给芯片供应商的。

DSP决定了光电信号的调制解调质量。没有DSP,光模块就是一堆镜片和光纤。全球DSP市场,Marvell(收购Inphi后)和博通合计吃下90-95%的份额。800G以上速率的DSP,国产化率等于零。

唯一在追这个赛道的A股公司是裕太微(688515)。它IPO及再融资合计13.6亿投入DSP研发。目前产品仍在研发阶段,量产时间表未定。

光模块厂商赚的是组装费。中际旭创全球第一,建立在两颗美国芯片的底座之上,不是"技术胜利",是"组装胜利"。我们可以为中国光模块的份额骄傲,但要知道那个份额下面的地基不是我们自己的。

这个结构有没有被打破的可能?有,答案是硅光。

传统光芯片(EML激光器)用铟磷这类III-V族化合物半导体,工艺极度依赖经验积累。住友和Lumentum深耕超过二十年,护城河来自时间本身。硅光芯片走了完全不同的路,在硅衬底上用CMOS工艺做光电器件,能借台积电、中芯国际的制造能力,绕开III-V族材料的工艺壁垒。

Intel、Cisco、Marvell在全球引领硅光。国内,光迅科技(002281)自研硅光芯片已有量产能力,中际旭创也在布局自研硅光方案。如果硅光路线跑通,中国有可能绕开InP/EML的卡脖子,这是在传统光芯片被锁死之后,唯一的弯道超车窗口。

但硅光还没全面替代。另一个更深远的变化已经在敲门了。

CPO,共封装光学——光模块这个行业的终局。

CPO的逻辑简单到残忍:把光引擎从可插拔的"盒子"里拿出来,直接封装到交换芯片旁边。功耗降50%以上,延迟大幅下降。但它同时意味着"可插拔光模块"这个产品形态会消失。供应链彻底洗牌,中际旭创新易盛可能变成被颠覆者,封装厂(长电科技(600584)、通富微电(002156))反而受益。竞争格局从"中国公司领先"变成"台积电说了算"。台积电COUPE方案2026年进入量产,刀已经架在脖子上了。

最后说光芯片本身。EML领域,高速(100Gbps以上)场景,住友和Lumentum把持绝大部分份额。CW激光器(硅光方案的配套光源),国产进展要快一些。源杰科技(688498)的CW激光器已量产出货,FY2025营收同比增长138.5%。但50G/100G EML仍在研发,尚未进入客户送样阶段。

低速已突破,高速差距大。InP/EML这道墙,硅光可能绕过去。但绕过去之前,这个环节还是日本人和美国人的地盘。

第④层:网络交换——英伟达生态的边界战争

CPO把光贴到交换芯片旁边。交换芯片本身,是另一道天堑。一道比GPU还集中的天堑。

GPU市场,英伟达一家独大。但AMD至少还有MI300X、MI350在追。HBM市场,SK海力士第一,三星和美光在后面咬。交换芯片市场,博通(Broadcom)在云数据中心领域的份额约90%。这个90%不是交换机整机的份额,是交换机里面那颗核心芯片的份额。

一颗51.2Tbps的Tomahawk 6交换芯片,单颗售价1500到2000美元。博通一年卖出的数据中心交换芯片,销售额轻松超过50亿美元。这个市场上,Marvell排第二,英伟达的Spectrum系列(收购Mellanox得来)排第三。两家加在一起的市场份额不到博通的三分之一。不是接近。是碾压。

博通的护城河来自哪里?设计能力,当然。但真正让后来者绝望的是30年积累的bug修复记录。

交换芯片每秒处理数千亿个数据包。任何一个包的转发逻辑出bug,整张网络出现丢包、环路、广播风暴。云厂商工程团队三十年踩过的坑,博通的固件和驱动已经修了一遍。这个"已知加未知bug"的数据库,没有后来者能用钱以外的方式复现。不是我们没能力设计一颗交换芯片。是我们没机会踩过那么多坑。

中国在这个环节只有一家公司站上了牌桌:盛科通信(688702)。

盛科是国内唯一做商用数据中心交换芯片的公司。它的25.6Tbps交换芯片已进入客户验证阶段,2025年Q3首次实现单季度盈利。从亏损到盈利,对一家芯片公司是质的跨越。但25.6Tbps对标的是博通上一代Tomahawk 4的水平。博通最新Tomahawk 6已经做到51.2Tbps。差距约一代半。在芯片行业,追一代半意味着什么?博通每年迭代,你原地追需要三到五年。前提是博通原地不动。博通不会原地不动。

但更关键的问题不是技术。是信任。

万卡集群一台交换机挂了,至少几百张GPU跟着断连。一次网络故障导致训练中断数小时,在大模型公司是重大事故。采购决策的第一权重不是价格,不是国产替代意愿,是"出了事,你负不负得了责"。这个"敢不敢用"的问题,比"能不能做"更难回答。

讲完交换芯片,必须讲一件事。英伟达的InfiniBand。

InfiniBand不是一款芯片,是一种网络协议,英伟达的私有领地。超低延迟(端到端约1微秒)、无损传输、原生支持RDMA。但只能和英伟达的设备一起用,买了英伟达GPU,就必须用英伟达的ConnectX网卡和InfiniBand交换机。卖GPU给你,还规定你必须用什么网络把它们连起来。这就是InfiniBand的本质。

以太网加RoCE v2是另一条路:标准协议、多厂商互通、延迟略高但"足够好"。AWS、Google、微软都不想被一家供应商锁死。2025年是转折点,UEC 1.0标准落地,新建万卡以上集群中以太网方案占比首次突破50%。不是以太网技术全面超越了InfiniBand,是云厂商用脚投票,选了一个不被英伟达绑架的未来。

交换机整机市场,思科和Arista是王者,但AI数据中心趋势是白牌化:云厂商直接买博通交换芯片,找ODM代工硬件,跑开源SONiC网络操作系统。紫光股份(000938)旗下的H3C和锐捷网络是这个浪潮的直接受益者。DPU/智能网卡方面,NVIDIA BlueField绝对主导,国产仍在早期阶段。

第⑤层:供电体系——算力的尽头是电力

先讲一个反常识的数字。

美国目前排队等待电网接入的AI数据中心项目,总规模超过50GW。50GW是什么概念?相当于50座大型核电站的满发功率。Goldman Sachs 2025年报告里的官方数字。这些项目排期4到11年不等。不是缺钱,不是缺地,是在排队等电。

AI算力真正的瓶颈不在晶圆厂,在电网。芯片造不出来可以排队等产能,三年后总能轮到你。电网接入点申请不下来,十年后也不一定轮到你。建一座晶圆厂3到5年,拉一条特高压线路8到10年,等一个电网接入点可以超过10年。芯片可以加速制造,物理基建是硬约束。工期不由任何科技公司决定。

GPU在指数级变快,电网在代数级扩张,两条曲线的剪刀差,才是AI规模化最大的敌人。把供电体系拆成三级来看:离GPU越近,电压越低,技术革命越密集。

L1 机柜级:离GPU最近的供电革命

传统数据中心一个机柜的功耗,6到8kW。放几台通用服务器,风扇慢悠悠转着,一年平平稳稳。

AI时代一个机柜的功耗,100kW起步。GB300 NVL72这种"超级Pod",一个机柜轻松突破300kW。

单个B200芯片功耗1000W,八张卡同时全功率运转,一个机柜42台服务器塞满,要解决的问题是"怎么把一个小区的用电塞进一个冰箱大小的空间"。

传统供电走12V母线,机柜配电柜到每台服务器走铜排,电流大到铜排发热,效率只有85%左右。100kW机柜走这条路,电流会大到铜排熔化。不是危言耸听,是基础物理。

48V直供解决了这个死结:电压提高4倍,同样功率下电流降为四分之一。电阻损耗与电流平方成正比,电流降四分之一,线路损耗降到十六分之一,效率从85%跳升到98%。这不是渐进优化,是供电架构的代际切换。

和48V直供配套出现的,是Power Shelf这个概念。传统数据中心每台服务器自己带一个PSU,像每家人自己装一台发电机。AI数据中心把PSU集中成一个Power Shelf,一个架子管整个机柜的供电。好处直接:集中管理效率更高,冗余设计更合理,坏了可以热插拔更换而不需要整台服务器停机。

更关键的变化是BBU,电池备份单元。传统数据中心用UPS,一个大铅酸电池房给整个机房备电。停电时铅酸电池切换到供电线路需要几十秒。几十秒在传统IT里不是问题。AI训练集群断一秒就是崩。几万张GPU的训练状态瞬间丢失,恢复成本以百万计。

BBU是锂电池,直接装在机柜里。和Power Shelf集成在一起。断电响应时间是毫秒级。它把一个传统UPS的功能,从"整个建筑的集中备电"下沉到了"每个机柜的独立备电"。响应快了三个数量级。

这个环节的中国供应链故事,藏在两个公司身上。

麦格米特(002851),它是目前全球唯一一家进入NVIDIA电源供应链的中国大陆厂商。NVIDIA AI服务器电源供应商名单极短:台达、光宝、群电、Artesyn,加上麦格米特。一只手数得过来。一个AI服务器机柜的Power Shelf,物料成本在几十万到上百万人民币区间。NVIDIA一年出货多少机柜,这个市场就有多大。这张牌桌上只有一个中国大陆玩家。电源在这个语境里不是配角。没有它,100kW到不了GPU。它是瓶颈。

欧陆通在服务器电源领域做国产替代,规模目前不如麦格米特,但方向一致。

L2 机房级:从机柜到数据中心

几百个100kW+机柜塞进一个数据中心,电怎么从电网送到每一排机柜?

传统方案是UPS:电网交流电整流成直流给电池充电,再逆变回交流给机柜供电。电走了一个"交-直-交"的三角迷宫。HVDC绕过这个迷宫,电网交流电整流成高压直流,直接送到机柜,省去两次转换损耗,效率从92%提到98%。一个100MW数据中心一年下来,这就是几千万度电、几千万人民币的电费差距。中恒电气(002364)是这个赛道的中国龙头,HVDC产品已进入多个AI数据中心项目。科华数据(002335)横跨UPS、配电、制冷和运维,是国内少有的综合型供应商。

L3 电网级:电从哪里来

这是供电体系最根本的一层,也是最让人焦虑的一层。机柜供电方案可以迭代,机房配电可以升级,电网扩容量需要十年。

前面讲了,美国AI数据中心电网排队规模超过50GW,排队4到11年。这不是哪个智库的悲观预测,是Goldman Sachs把实际申报项目一个个数出来的结果。

微软的选择说明了一切。2025年,微软签下宾州三哩岛核电站的重启协议,20年PPA,835MW供电容量,美国能源部10亿美元专项贷款。三哩岛,1979年美国最严重核事故的发生地,AI公司让它的核反应堆重新启动。亚马逊买下宾州Susquehanna核电站旁960MW直连数据中心项目,Google和Kairos Power在签小型模块化核反应堆协议。AI公司从"电力用户"变成了"电力玩家"。

中国走了一条更聪明的路。

"东数西算"不是把东部数据中心搬到西部,是把西部便宜的绿电变成算力,再用光纤送回东部。内蒙古风电上网电价两到三毛一度,东部工业用电五到八毛。内蒙古有广袤土地、便宜风电、充足日照,天然具备承载超级数据中心的资源禀赋。

特高压是这条路的物理前提。没有特高压,"东数西算"无从谈起。中国过去二十年建成了全球最大规模的特高压电网网络。这是AI时代的隐性地基。建特高压时没人想到AI,但特高压建成后,AI是最大的受益者之一。

储能在这个语境里有了新角色:阳光电源(300274)的储能系统正在替代柴油发电机给数据中心做后备电源,宁德时代(300750)的储能电池也在进场。储能在这里不是削峰填谷,是给GPU集群当巨型BBU,断电20秒的损失可以追平一套储能系统的全生命周期成本。

这一层的核心张力很清楚。电力问题比芯片问题更难解决。芯片产能紧张,台积电开一条新产线3年。电网接入一个50GW级的排队列表,清空需要十年。两个维度的时间尺度不在一个数量级上。技术可以指数增长,物理基建只能线性铺设。AI的终极瓶颈不在光刻机,在输电线。

第⑥层:散热体系——当1000W遇上物理定律

2025年3月31日,3M宣布旗下Novec系列浸没式冷却液停止接单,2025年底前全面停产。3M Novec占全球浸没冷却液约80%份额,一个统治级玩家自己宣布退场,数千亿市场核心耗材的供应说停就停,供应链重塑窗口2到3年。

B200单卡功耗1000W之后,散热从配角变成了主角。不是技术偏好,是物理定律:一台8卡AI服务器GPU功耗8kW,一个40U标准机柜塞4到5台,整柜热负荷直奔60kW。风冷物理极限约30到40kW/机柜,空气热容太低,不是我们选液冷,是物理定律替我们选了液冷。

冷板式液冷:当前主力

冷板式液冷占AI服务器散热方案的70%以上。一块铝合金或铜制冷板紧贴GPU封装盖板,冷却液从微通道流过带走热量,升温后到CDU(冷量分配单元)交换给外部冷却塔,降温后再流回。循环简单,做好极难:冷板微通道加工精度要到微米级,几千个冷板在同一管路系统里,流量分配不能有一个偏。某个GPU的冷板流量偏了10%,温度比旁边高15度,寿命差距以年计。

全球冷板方案由欧洲Asetek、加拿大CoolIT主导,台系双鸿和奇鋐主导规模交付。英维克(002837)是中国液冷产业链位置最好的公司,CDU加冷板方案已进入Google等超大规模客户供应链,意义不亚于中际旭创当年进入英伟达。高澜股份(300499)从电网液冷起家转型AI服务器液冷,大功率液冷经验有了意想不到的用武之地。

浸没式液冷:最性感,最贵,最大变数

浸没式液冷更彻底,整台服务器泡在绝缘冷却液里。分两种:单相浸没靠泵循环,技术成熟;两相浸没靠芯片表面沸腾,散热效率更高但系统复杂度翻倍。优势是PUE可压到1.03以下,缺点则是贵:冷却液一桶价格是水的几百倍,机柜必须定制,服务器维修等于从液体里捞出来拆开。

3M退出让替代供给加速。索尔维、科慕等国际化工巨头在填充缺口,国产氟化液也在追赶。巨化股份(600160)、新宙邦(300037)、润禾材料(300727)三家是主力,国产份额从2023年的不到10%升到了2025年的30-40%。窗口期不长,如果2到3年内不能做到国际一线水平,3M空出来的份额大概率被欧美巨头接走。

3D VC均温板:最后一毫米

热从GPU die传到冷板,中间隔着一层界面材料。3D VC均温板解决这"最后一毫米":封在铜壳内的真空腔体,工质液体在热点气化、冷端凝结,靠毛细力循环。等效导热率是纯铜的几十倍。台系双鸿和奇鋐全球领先,中石科技(300684)和飞荣达(300843)正在追赶,但3D VC微结构的精密焊接和工质填充是独门技艺,差距不是投钱就能缩短的。

中国液冷产业链的独特身位

把液冷拆成CDU、管路、冷板、冷却液、冷源五个环节,中国拥有全球最完整产业链。从英维克的CDU到高澜的冷板,从巨化、新宙邦的氟化液到格力、美的的冷源方案,每一环都有中国公司站上了牌桌。光模块强但DSP被卡,服务器强但GPU被卡,而液冷是全链条独立自主,在局部还有领先。

第⑦层:数据中心基础设施——不是地产,是精密仪器

AI数据中心不是盖房子。是造一台以"平方公里"为单位的超级计算机。

这个判断听起来夸张,但我们把一个万卡集群的BOM拆开来看。GPU 60%,网络设备 15%,供电和散热 12%,土建只有 8%,其他杂项 5%。土地和钢筋水泥,只占整个万卡集群建设成本的零头。真正烧钱的是设备,不是楼。

这意味着什么?评价一家AI数据中心公司,不该用地产商的逻辑,看地价、看出租率、看资产周转,那是衡量写字楼的方法。该用精密仪器制造商的逻辑:看功率密度,看PUE,看交付速度,看设备利用率。对标的不该是万科,是台积电。

选址:比造芯片更难的学问

传统数据中心选址看地价、电价、政策。AI数据中心加了三个硬约束:光纤延迟圈(推理延迟<1ms,数据中心离用户不超过100公里)、电力容量(200MW单点容量正在变成入场券)、散热水源(液冷需要稳定水源)。三个约束叠在一起,全球AI数据中心物理布局就被锁死了,北美集中在弗吉尼亚Ashburn、硅谷和凤凰城,欧洲锁在爱尔兰、荷兰和法兰克福,亚太集中在东京、新加坡和中国的西部能源基地。这些同样也是物理定律画出来的圈。

润泽科技:把数据中心做成了"算力地产"

A股数据中心公司里,润泽科技(300442)是规模最大的一家。

它的逻辑很清晰:拿地、拿能耗指标(能评)、建大规模数据中心园区、批发给云厂商和AI公司。目前运营容量750MW,2025年AIDC业务收入同比增长73%。海外规划了600MW容量,正在向外走。这是一个把"算力地产"模式跑通了的样本。

但润泽赚的不是地价差,而是电力容量和能耗指标的稀缺溢价。这门生意的本质是"先占坑",坑的容量是电网和发改委画死的,后来者有钱也进不来。

数据中心A股的玩家不止润泽一家。数据港(603881)深度绑定阿里云,是定制型数据中心的标杆,运营容量超过500MW。万国数据(GDS)和世纪互联(VNET)在美股上市,是国内第三方数据中心的两大老牌劲旅,近年来也在向AI算力枢纽转型。这个赛道的共同特征是:重资产、慢回报、高壁垒,一旦建成了、租出去了,现金流极度稳定。但进入门槛也在快速抬高,核心不在于建设能力,而在于前述的能评指标和电力接入审批。

东数西算的真相

光环新网(300383)和奥飞数据(300738)是东数西算核心节点的代表性运营商。八大算力枢纽(京津冀、长三角、粤港澳、成渝、内蒙古、宁夏、甘肃、贵州)构成了一张覆盖全国的算力基础设施骨架。

东数西算不是把东部数据中心搬到西部。它的逻辑本质是:西部绿电变成算力,再用光纤和特高压送回东部。训练在西部(不care延迟),推理在东部(必须小于1毫秒)。这不是政策口号,是一道算术题,电价差乘以用电量,省出来的数字足够建一座新数据中心。

这个分工决定了未来中国AI算力基础设施的物理布局。不是一个选项,是一道物理加经济的必答题。

模块化与算力地产的未来

传统数据中心从拿地到交付需要2到3年,AI等不了。模块化数据中心把周期压缩到6到9个月,供电、制冷、机柜、消防全部工厂预制,现场拼装。中兴通讯和华为是核心推手。这个转型的深远含义是:建设壁垒在降低。靠"我能建"为护城河的公司壁垒在消融,未来竞争从"谁能建"转向"谁有能耗指标""谁有电力容量""谁有客户"。物理资源的稀缺,正在取代工程能力的稀缺。

Token工厂:数据中心的新身份

一个正在浮出水面的叙事是"Token工厂":AI数据中心本质上不再是存放服务器的仓库,而是规模化生产token的制造工厂。工厂的核心KPI不是租金和出租率,而是单位电力产出多少token、单位时间创造多少AI产值。从这个角度,一家AI数据中心的真实对标不是万科,甚至不是台积电,是电厂,卖的不是空间,是算力和token。这一定位也将"算电协同"政策推到了台前:国家层面正在推动算力规划与电力规划统一布局,数据中心建在哪、电网扩容到哪,统筹决策,对中国AI基础设施的长期竞争格局影响深远。

第⑧层:算力平台与GPU云——英伟达想当军阀

这是八层天堑的最后一层。也是最精彩的一层。

前面七层解决了一个问题:把几万颗GPU拼成一台能用的超级计算机。但搭好之后,谁用它?怎么卖?

答案叫GPU云。把算力切成小时、月、年的租约,卖给需要训练或推理的公司。这件事听起来像AWS卖虚拟机,但底层逻辑完全不同。AWS卖的是通用算力,拼的是规模和多产品线。GPU云卖的是AI算力,拼的是谁手里有GPU。

而GPU是谁造的?英伟达。

这就是一切混乱的根源。

三种势力,三张牌

GPU云市场上有三股势力在互相撕咬。

第一股,正规军。AWS、Azure、Google Cloud。它们的牌是客户黏性。全球几百万家企业已经在它们的云上跑业务,顺手租GPU训练模型,这是最短的迁移路径。三巨头还有一张暗牌:自研芯片。AWS有Trainium,Google有TPU,微软有Maia。它们今天还在大量买英伟达GPU,但同时在写自己的替代方案。不是今年替代,是五年后的备手。

第二股,军火商兼军阀。英伟达自己的DGX Cloud。英伟达卖GPU给所有人,但它自己也下场做云服务。你从英伟达买的GPU,它用同样的GPU和你抢同一个客户。这是商业史上罕见的"上游吞噬下游"案例。DGX Cloud的筹码是GPU优先供应权和CUDA生态锁定。全球GPU缺货时,所有云厂商都在排队等英伟达发货。DGX Cloud不需要排队,它自己就是发货的人。DGX Cloud已签订的多年合同金额达到109亿美元。这不是小打小闹,是一个军火商宣布自己也要上战场。

第三股,游击队。CoreWeave从以太坊矿场起家,2022年底囤了数万张H100,靠GPU抵押融资、买更多GPU、再抵押,从矿场变成了AI云,市值一度超过600亿美元,2026年预期营收120到130亿美元。三方各有筹码:正规军有客户黏性,军火商有货源优势,游击队有先发囤货的时间差。谁都吞不掉谁,这是一个三方博弈的死局。

英伟达的两难

DGX Cloud是一个危险的游戏。左手,AWS、微软、Google每年买英伟达GPU的金额以百亿美元计,英伟达是它们的供应商。右手,DGX Cloud在抢这些云厂商的GPU客户,英伟达是它们的竞争对手。能同时当最大的供应商和直接的竞争对手多久?

云厂商的反制出奇一致:全部在自研芯片。AWS的Trainium 2已量产,Google的TPU v5p支撑Gemini训练,微软Maia 100开始内部部署。三巨头一边继续买英伟达GPU,一边悄悄把自己变成"有一天可能不再需要英伟达"的公司。英伟达想在食物链上往上爬,每往上爬一级,上一级的客户就变成下一级的对手,GPU制造全球独大,GPU云却没有客户服务基因,云服务不是硬件垄断可以平移的。

中国的独特变数

中国GPU云市场画出了完全不同的轨迹,最核心的差异只有一个:英伟达高端GPU进不来。H100、B200全部受限,中国AI云的底座必须建立在国产GPU上。

阿里云占据中国AI云约36%份额,策略是对冲:一边维持英伟达合规GPU(H20、A800)供应,一边加速接入寒武纪、海光等国产GPU。华为云走全栈自主路线,昇腾芯片加ModelArts开发平台,从芯片到框架全部自研。这个局面逼出一个战略问题:国产GPU加国产云平台,能否形成独立生态?

短期不太能。国产GPU的单卡性能、软件生态、大规模集群稳定性离英伟达体系还有差距。但长期来看,被迫隔离可能加速生态成熟,当一个市场被从全球供应链切出去,内部的供需配对会自己找到平衡。如果英伟达GPU一直进不来,中国的封闭生态反而可能比开放生态跑得快。封锁越严,替代越快。但替代成功的前提是:国产芯片和云平台在性能天花板被锁死之前,先跑通商业闭环。

收尾:中游的终局,下游的开场

八层天堑,已全部拆完。站远一步,看整体。

离芯片越近,护城河越深,玩家越少,但越隐形。NVLink只有英伟达能做,铜缆和PCB有几家中国公司站上了牌桌,光模块做到了全球第一但DSP被人掐着,到了GPU云已经三方撕咬。越往下游,玩家越多,利润越薄,市场越大。这些都不是偶然,离物理极限越近,能翻过墙的公司越少;离用户越近,市场越大,壁垒越薄。

上游的护城河来自"别人追不上"。台积电3nm良率、住友InP激光器工艺,不是我们多投钱就能追上。它需要我们坐上时光机回到二十年前,但我们回不去。中游的护城河来自"别人不敢换"。换光模块供应商要先停掉整个万卡集群,换液冷方案要重新做几千个冷板的流量调优。你敢不敢?"敢不敢"三个字,就是中游寡头的全部护城河。

两种护城河一样深。但中游寡头更隐形,AI模型跑在中际旭创的光模块上、靠着英维克的液冷、用着麦格米特的Power Shelf。它们是算力基础设施的"影子内阁"。看不见,但缺一个就翻车。

一颗芯片变成万卡集群,涉及上成百上千家供应商、成千上万名工程师。分工复杂到应该百花齐放,但规模效应走到极致是寡头垄断。每个技术环节跑完一轮洗牌,最终只剩两三家公司在收税。因为门槛太高,高到后来者爬不上来,在位者只要不出大错,护城河自动加宽。

中游篇到这里已经拆解完了。万亿投资砸下去后几万张GPU连成了集群。算力搭好了,但算力本身不创造价值,使用算力才创造价值。下游怎么用?算力怎么变现?后续的下游篇我们再来深度拆解。

风险提示和免责声明

本文所有内容仅代表我的个人观点,不构成任何投资建议!

作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。

合规声明:本站发布的所有文章及观点均系个人研究共享,投资心得交流,不代表本站立场,且不构成任何形式的投资建议。投资者据此操作,风险自担,请务必保持独立审慎的决策态度。