AI算力产业链深度拆解②之中游篇

2026-05-19 22:06:4934℃

本文为「AI算力产业链深度拆解」系列第二篇。全系列共三篇，分别拆解上游（造出来）、中游（搭起来）、下游（用起来）。本文聚焦中游，从一颗芯片到万卡集群，看清谁在英伟达的光环之外，筑起了另一道护城河。

上游把芯片造出来了。但一颗B200离开台积电封装厂的那一刻，它离"能用"还很远。

一颗B200每秒20 petaflops算力，人类半导体工业的巅峰之作。但它单独什么也做不了，需要7个同伴组成一台8卡服务器，连到其他几千台服务器，共享一个"神经系统"来同步每一次梯度计算。电力系统供给兆瓦级能量，散热系统带走等于8台吹风机满功率的热量。任何一个环节掉链子，几十亿建起的算力集群利用率可能不到60%。一个万卡集群从硬件安装到软件调通，平均耗时3到6个月。

三组数字感受一下规模：

B200单卡功耗1000W。一台8卡服务器，仅GPU供电就是8000W。一个机柜42台这样的服务器，配电系统要扛超过300千瓦。

一个万卡集群，仅GPU和配套基础设施的电费，一天约50万度，相当于一个20万人小镇的居民日用电量，一年电费超过1.8亿人民币。

建一个万卡集群的硬件成本，在25到35亿人民币之间，还没算土地、基建和制冷系统。大致等于北京市中心一栋甲级写字楼的价格。

搭个服务器而已，能有多难？这是整个AI产业链上最昂贵的误解。上游是"造不造得出来"的生死题，中游是"搭不搭得起来"的工程题。前者听着更性感，后者其实更烧钱，烧完钱之后没有退路，选的供应商、定的技术路线一旦锁定，切换代价大到没人敢换。

从一颗芯片到万卡集群，隔着八道工程天堑。每一道天堑旁边，都站着一批寡头。它们不如英伟达耀眼。但它们的护城河来自同一个源头：规模诅咒。每上一个数量级，物理定律就砸一堵新墙。翻过墙的公司，得到的回报是没人敢换它。

上游的护城河是"别人追不上"。中游的护城河是"别人不敢换"。两种护城河一样深。但中游的寡头，更隐形。

这一篇，我们从一颗芯片出发，一层一层往上搭，看清整个中游的地图。

八层结构：①AI服务器，藏着最值钱的私有协议NVLink；②高速互联，速率翻倍就洗牌；③光模块与CPO，中国最强，也最易被偷家；④网络交换，万卡集群不掉链子靠交换芯片；⑤供电体系，单机柜功率从15kW飙到300kW；⑥散热体系，液冷从可选变必选；⑦数据中心，重资产、慢回报的隐形壁垒；⑧算力平台，硬件搭好，卖出去才是本事。

八层天堑，我们一层一层拆解。

第①层：AI服务器与GPU互联——英伟达最深的护城河，藏在一条私有高速公路里

提到英伟达的护城河，大多数人的第一反应是CUDA。

CUDA确实深。几百万AI工程师习惯了它的编程模型，换平台等于重新学一门语言。软件生态的粘性，是最强的一种锁定。

但CUDA不是最深的。

NVLink才是。

NVLink是英伟达自研的GPU-to-GPU互联协议。它解决的问题极其具体：8颗GPU装进一台服务器，它们之间怎么通信？

用标准PCIe？一台8卡服务器走PCIe 5.0，GPU间传数据的延迟是微秒级，带宽128GB/s。听着不慢。但对于大模型训练来说，每一次前向和反向传播，8颗GPU都在疯狂交换梯度数据。微秒级延迟意味着60%的计算时间浪费在等待上。

NVLink干了一件简单粗暴的事：甩开PCIe这条"公共马路"，给GPU之间修了一条"私家高速公路"。当前第五代NVLink，单链路双向带宽900GB/s。8颗B200 GPU通过4颗NVSwitch芯片做全互联，任意两颗GPU之间的有效带宽达到1.8TB/s。下一代Blackwell Ultra平台，NVLink 6把这个数字推到3.6TB/s。

比PCIe 5.0快了一个数量级。这不是改进，是代差。

NVLink-NVSwitch体系是英伟达独家技术。全球没有第二家公司有同等级量产产品。华为UB-Mesh（基于HCCS总线）是国内最接近的追赶者，号称10Tbps带宽、150ns延迟，但生态成熟度和量产规模上，至少隔着一代。

这为什么是护城河？

因为NVLink制造了一个"要么全用英伟达，要么全不用"的锁定效应。你想搭一台8卡AI服务器，GPU得买英伟达的。你想让这8颗GPU高效工作，互联方案也必须是英伟达的。NVSwitch芯片、NVLink桥接器、配套PCB走线和固件，一整套封闭体系。你没法混搭：买4颗英伟达GPU配4颗国产GPU，然后通过开放总线通信。不行。

这种锁定从服务器级一路延伸到机柜级。

GB300 NVL72是英伟达最新的"超级Pod"形态。72颗Blackwell Ultra GPU通过NVLink Switch全连到一个机柜里，组成逻辑上的一颗"巨型GPU"。72颗GPU共享同一个内存地址空间。编程模型上，它就是一颗芯片。

一台GB300 NVL72机柜，仅GPU和NVLink互联系统的物料成本就逼近3000万人民币。北京一套房。

谁在为英伟达搭服务器？

GPU是英伟达设计的。NVLink是英伟达设计的。但把GPU、NVSwitch、内存、电源、散热器集成到一台物理服务器里这个活，英伟达不自己干。

它提供MGX参考设计（一种模块化服务器架构），ODM厂商照着设计做工程实现、供应链管理和大规模制造交付。

这个环节全球最大的玩家是工业富联(601138)。

工业富联是鸿海（富士康）旗下的云计算设备制造平台。它的AI服务器营收过去一年增长了超过3倍。FY2025全年，工业富联营收9029亿人民币，同比增长48.2%。云计算业务（含AI服务器）营收6027亿，同比增长88.7%，占总收入的三分之二。归母净利353亿，同比增长52%。2026年一季度，AI GPU机柜出货量同比增长3.8倍，势头未减。

什么概念？全球每出货一批AI服务器，相当一部分贴着工业富联的制造标签。英伟达、亚马逊、微软、Google，它们的AI服务器机箱上印着Foxconn Industrial Internet。

ODM模式的壁垒在哪？规模。年产几十万台服务器的供应链管理能力、品质一致性、全球交付网络，不是投钱就能短期复制的。一个万卡集群的交期错过一个月，客户损失以亿计。谁敢换一个没经过大规模验证的供应商？

国内另一个重要角色是浪潮信息(000977)。它是国产AI服务器的主力，尤其在信创和运营商市场。基于昇腾、海光等国产芯片的AI服务器，浪潮是最大的系统集成商之一。

BMC：服务器里那颗最重要的隐形芯片

BMC是基板管理控制器，服务器的"独立监护人"，有自己的供电和网口。主CPU宕机了，BMC还在运行，远程开关机、监控温度电压、推送告警。数据中心运维管理几万台服务器，靠的就是BMC。

全球BMC市场，台湾信骅科技（Aspeed）市占率超70%，第二名新唐科技约15%，两家合计超85%。国内华为海思的BMC主要用于自研服务器，国民技术(300077)在信创BMC上有布局，国产替代刚起步。

第②层：高速互联介质——铜退光进，速率每翻一倍就洗一次牌

第①层的NVLink是服务器内部的私有高速公路。第②层是服务器之间、机柜之间的公共交通网。

这个网络有一个核心矛盾：速率每翻一倍，传输介质就重新洗牌一次。

背后的物理原理很简单。电信号在铜线里跑，距离越长，高频成分衰减越狠。800G时代，铜缆还能守住3米以内的机柜内互联。1.6T时代，铜的有效距离缩到1米以内。到了3.2T和CPO时代，光必须直接贴到芯片封装旁边。电信号的物理极限到了。

这是光不断逼近芯片、铜不断后退的持久战。铜不会消失。但铜的领地每一代都在收缩。

铜缆的逆向繁荣

传统服务器内部铜缆用量0.5到1公斤。AI服务器是另一个物种，8颗GPU全互联，GPU到NVSwitch、网卡、电源、风扇全是高密度线束，一台8卡AI服务器铜缆用量4到8公斤，传统服务器的7到8倍。铜缆整体市场在萎缩，但AI服务器的铜缆用量在爆发，一个缩小的市场里长出了暴增的细分。铜退光进不是铜缆的末日，是介质切换驱动的增量窗口。

具体产品分三类：

DAC，无源直连铜缆。纯铜线，无信号处理芯片。最便宜，距离最短，一般0.5到3米。机柜内GPU到交换机的主力方案。

ACC，有源铜缆。铜线加模拟信号均衡芯片。比DAC多跑一段距离，成本居中。

AEC，有源电缆。铜线加完整Retimer芯片。距离最长，成本最高。跨机柜短距互联用。

全球DAC/ACC/AEC高速铜缆市场，安费诺（Amphenol）、莫仕（Molex）、泰科（TE Connectivity）三家合计约79%份额。

A股中，立讯精密(002475)的224G铜缆已量产。这是目前全球最高速率等级，能支撑1.6T端口。兆龙互连(300913)在高速DAC领域也有布局。

连接器：国产替代在门缝里

224G信号通过一个连接器接口，对阻抗匹配、串扰抑制、机械精度的要求到了变态级别。引脚间距0.5mm，内部屏蔽结构加工公差微米级，不是"插头插座"，是精密机电一体化产品。全球高速背板连接器市场安费诺一家独大，与英伟达深度绑定。瑞可达(688800)在56G/112G连接器上已批量供货，鼎通精密(688668)在高速I/O连接器壳体上有积累。国产替代的窗在开，但刚起步。

高速PCB和覆铜板：一块板子的材料决定了信号能跑多远

NVLink的信号在PCB上跑。224G信号过一张印刷电路板，对板材的要求高到了另一个级别。

普通服务器PCB用FR-4或Mid-Loss级别材料。AI服务器必须用M7或M8级超低损耗覆铜板。M7/M8的高频介电损耗比FR-4低一个数量级。只有用这种材料，224G信号跑十几厘米之后眼图还睁着。

M7/M8覆铜板全球由松下电工（Megtron系列）和台光电主导。A股中，沪电股份(002463)和深南电路(002916)在AI服务器高速PCB上取得重要突破。深南电路14层以下高速板已量产，16层已送样英伟达验证。

中国是全球最大PCB制造国。但M7/M8级覆铜板的上游原材料（超低损耗树脂），国产化率仍然不高。材料端的突破，比PCB制造本身更需要时间。

Retimer：信号会"坏在路上"

224G PAM4信号经铜缆或PCB长距离传输后，质量严重劣化。误码率从10⁻¹⁵掉到10⁻⁹，整个万卡集群每小时产生数十万次数据重传。训练效率断崖式下降。

所以需要Retimer或Redriver芯片在信号中途做修复。

Redriver是模拟方案：放大加均衡，成本低但能力有限。Retimer是数字方案：完整提取时钟再重新发送，成本高但效果好。224G时代，Retimer是主流。

全球PCIe/CXL Retimer市场，Astera Labs以约86%的份额一骑绝尘。A股中，澜起科技(688008)的PCIe 5.0 Retimer已量产出货，全球市占率约10.9%，排名第二。这是国产芯片在高速互联领域少数站上全球牌桌的案例。

高速互联是中游变化最快、格局最不稳定的环节。每一次介质切换，都意味着上一批公司的技术护城河被绕过去、下一批公司崛起。这不是"强者恒强"的赛道，是"快者生存"的赛道。切换就是洗牌，洗牌就是机会。中国公司在铜缆和PCB上已有确定竞争力，连接器和Retimer在追赶，差距正在肉眼可见地缩小。

第③层：光模块/CPO——组装胜利，还是技术胜利？

第②层讲的是铜。铜跑不远，超过3米就得换光。这件事中国公司做到了全球第一。

三组数字。中际旭创(300308)FY2025营收382亿人民币，同比增长60.3%；净利润108亿，同比增长108.8%。800G光模块全球出货份额40-50%，稳居第一。新易盛(300502)和天孚通信(300394)紧随其后。全球绝大多数AI GPU集群里插着的光模块，标签上写着中国公司的名字。

单看这三组数字，我们会觉得这是中国半导体最漂亮的一张出海成绩单。

但把一张800G光模块的BOM表拆开，故事就变了。

一颗800G光模块，DSP数字信号处理芯片占成本30%以上。光芯片（EML激光器或CW激光器）再占25%以上。光模块厂商自己的制造成本和毛利加在一起，只有20-30%。中际旭创已经是全球第一大光模块公司了，它的综合毛利率约31%。不低，但我们要知道它卖一个800G光模块收1000多美元，其中超过550美元是付给芯片供应商的。

DSP决定了光电信号的调制解调质量。没有DSP，光模块就是一堆镜片和光纤。全球DSP市场，Marvell（收购Inphi后）和博通合计吃下90-95%的份额。800G以上速率的DSP，国产化率等于零。

唯一在追这个赛道的A股公司是裕太微(688515)。它IPO及再融资合计13.6亿投入DSP研发。目前产品仍在研发阶段，量产时间表未定。

光模块厂商赚的是组装费。中际旭创全球第一，建立在两颗美国芯片的底座之上，不是"技术胜利"，是"组装胜利"。我们可以为中国光模块的份额骄傲，但要知道那个份额下面的地基不是我们自己的。

这个结构有没有被打破的可能？有，答案是硅光。

传统光芯片（EML激光器）用铟磷这类III-V族化合物半导体，工艺极度依赖经验积累。住友和Lumentum深耕超过二十年，护城河来自时间本身。硅光芯片走了完全不同的路，在硅衬底上用CMOS工艺做光电器件，能借台积电、中芯国际的制造能力，绕开III-V族材料的工艺壁垒。

Intel、Cisco、Marvell在全球引领硅光。国内，光迅科技(002281)自研硅光芯片已有量产能力，中际旭创也在布局自研硅光方案。如果硅光路线跑通，中国有可能绕开InP/EML的卡脖子，这是在传统光芯片被锁死之后，唯一的弯道超车窗口。

但硅光还没全面替代。另一个更深远的变化已经在敲门了。

CPO，共封装光学——光模块这个行业的终局。

CPO的逻辑简单到残忍：把光引擎从可插拔的"盒子"里拿出来，直接封装到交换芯片旁边。功耗降50%以上，延迟大幅下降。但它同时意味着"可插拔光模块"这个产品形态会消失。供应链彻底洗牌，中际旭创、新易盛可能变成被颠覆者，封装厂（长电科技(600584)、通富微电(002156)）反而受益。竞争格局从"中国公司领先"变成"台积电说了算"。台积电COUPE方案2026年进入量产，刀已经架在脖子上了。

最后说光芯片本身。EML领域，高速（100Gbps以上）场景，住友和Lumentum把持绝大部分份额。CW激光器（硅光方案的配套光源），国产进展要快一些。源杰科技(688498)的CW激光器已量产出货，FY2025营收同比增长138.5%。但50G/100G EML仍在研发，尚未进入客户送样阶段。

低速已突破，高速差距大。InP/EML这道墙，硅光可能绕过去。但绕过去之前，这个环节还是日本人和美国人的地盘。

第④层：网络交换——英伟达生态的边界战争

CPO把光贴到交换芯片旁边。交换芯片本身，是另一道天堑。一道比GPU还集中的天堑。

GPU市场，英伟达一家独大。但AMD至少还有MI300X、MI350在追。HBM市场，SK海力士第一，三星和美光在后面咬。交换芯片市场，博通(Broadcom)在云数据中心领域的份额约90%。这个90%不是交换机整机的份额，是交换机里面那颗核心芯片的份额。

一颗51.2Tbps的Tomahawk 6交换芯片，单颗售价1500到2000美元。博通一年卖出的数据中心交换芯片，销售额轻松超过50亿美元。这个市场上，Marvell排第二，英伟达的Spectrum系列（收购Mellanox得来）排第三。两家加在一起的市场份额不到博通的三分之一。不是接近。是碾压。

博通的护城河来自哪里？设计能力，当然。但真正让后来者绝望的是30年积累的bug修复记录。

交换芯片每秒处理数千亿个数据包。任何一个包的转发逻辑出bug，整张网络出现丢包、环路、广播风暴。云厂商工程团队三十年踩过的坑，博通的固件和驱动已经修了一遍。这个"已知加未知bug"的数据库，没有后来者能用钱以外的方式复现。不是我们没能力设计一颗交换芯片。是我们没机会踩过那么多坑。

中国在这个环节只有一家公司站上了牌桌：盛科通信(688702)。

盛科是国内唯一做商用数据中心交换芯片的公司。它的25.6Tbps交换芯片已进入客户验证阶段，2025年Q3首次实现单季度盈利。从亏损到盈利，对一家芯片公司是质的跨越。但25.6Tbps对标的是博通上一代Tomahawk 4的水平。博通最新Tomahawk 6已经做到51.2Tbps。差距约一代半。在芯片行业，追一代半意味着什么？博通每年迭代，你原地追需要三到五年。前提是博通原地不动。博通不会原地不动。

但更关键的问题不是技术。是信任。

万卡集群一台交换机挂了，至少几百张GPU跟着断连。一次网络故障导致训练中断数小时，在大模型公司是重大事故。采购决策的第一权重不是价格，不是国产替代意愿，是"出了事，你负不负得了责"。这个"敢不敢用"的问题，比"能不能做"更难回答。

讲完交换芯片，必须讲一件事。英伟达的InfiniBand。

InfiniBand不是一款芯片，是一种网络协议，英伟达的私有领地。超低延迟（端到端约1微秒）、无损传输、原生支持RDMA。但只能和英伟达的设备一起用，买了英伟达GPU，就必须用英伟达的ConnectX网卡和InfiniBand交换机。卖GPU给你，还规定你必须用什么网络把它们连起来。这就是InfiniBand的本质。

以太网加RoCE v2是另一条路：标准协议、多厂商互通、延迟略高但"足够好"。AWS、Google、微软都不想被一家供应商锁死。2025年是转折点，UEC 1.0标准落地，新建万卡以上集群中以太网方案占比首次突破50%。不是以太网技术全面超越了InfiniBand，是云厂商用脚投票，选了一个不被英伟达绑架的未来。

交换机整机市场，思科和Arista是王者，但AI数据中心趋势是白牌化：云厂商直接买博通交换芯片，找ODM代工硬件，跑开源SONiC网络操作系统。紫光股份(000938)旗下的H3C和锐捷网络是这个浪潮的直接受益者。DPU/智能网卡方面，NVIDIA BlueField绝对主导，国产仍在早期阶段。

第⑤层：供电体系——算力的尽头是电力

先讲一个反常识的数字。

美国目前排队等待电网接入的AI数据中心项目，总规模超过50GW。50GW是什么概念？相当于50座大型核电站的满发功率。Goldman Sachs 2025年报告里的官方数字。这些项目排期4到11年不等。不是缺钱，不是缺地，是在排队等电。

AI算力真正的瓶颈不在晶圆厂，在电网。芯片造不出来可以排队等产能，三年后总能轮到你。电网接入点申请不下来，十年后也不一定轮到你。建一座晶圆厂3到5年，拉一条特高压线路8到10年，等一个电网接入点可以超过10年。芯片可以加速制造，物理基建是硬约束。工期不由任何科技公司决定。

GPU在指数级变快，电网在代数级扩张，两条曲线的剪刀差，才是AI规模化最大的敌人。把供电体系拆成三级来看：离GPU越近，电压越低，技术革命越密集。

L1 机柜级：离GPU最近的供电革命

传统数据中心一个机柜的功耗，6到8kW。放几台通用服务器，风扇慢悠悠转着，一年平平稳稳。

AI时代一个机柜的功耗，100kW起步。GB300 NVL72这种"超级Pod"，一个机柜轻松突破300kW。

单个B200芯片功耗1000W，八张卡同时全功率运转，一个机柜42台服务器塞满，要解决的问题是"怎么把一个小区的用电塞进一个冰箱大小的空间"。

传统供电走12V母线，机柜配电柜到每台服务器走铜排，电流大到铜排发热，效率只有85%左右。100kW机柜走这条路，电流会大到铜排熔化。不是危言耸听，是基础物理。

48V直供解决了这个死结：电压提高4倍，同样功率下电流降为四分之一。电阻损耗与电流平方成正比，电流降四分之一，线路损耗降到十六分之一，效率从85%跳升到98%。这不是渐进优化，是供电架构的代际切换。

和48V直供配套出现的，是Power Shelf这个概念。传统数据中心每台服务器自己带一个PSU，像每家人自己装一台发电机。AI数据中心把PSU集中成一个Power Shelf，一个架子管整个机柜的供电。好处直接：集中管理效率更高，冗余设计更合理，坏了可以热插拔更换而不需要整台服务器停机。

更关键的变化是BBU，电池备份单元。传统数据中心用UPS，一个大铅酸电池房给整个机房备电。停电时铅酸电池切换到供电线路需要几十秒。几十秒在传统IT里不是问题。AI训练集群断一秒就是崩。几万张GPU的训练状态瞬间丢失，恢复成本以百万计。

BBU是锂电池，直接装在机柜里。和Power Shelf集成在一起。断电响应时间是毫秒级。它把一个传统UPS的功能，从"整个建筑的集中备电"下沉到了"每个机柜的独立备电"。响应快了三个数量级。

这个环节的中国供应链故事，藏在两个公司身上。

麦格米特(002851)，它是目前全球唯一一家进入NVIDIA电源供应链的中国大陆厂商。NVIDIA AI服务器电源供应商名单极短：台达、光宝、群电、Artesyn，加上麦格米特。一只手数得过来。一个AI服务器机柜的Power Shelf，物料成本在几十万到上百万人民币区间。NVIDIA一年出货多少机柜，这个市场就有多大。这张牌桌上只有一个中国大陆玩家。电源在这个语境里不是配角。没有它，100kW到不了GPU。它是瓶颈。

欧陆通在服务器电源领域做国产替代，规模目前不如麦格米特，但方向一致。

L2 机房级：从机柜到数据中心

几百个100kW+机柜塞进一个数据中心，电怎么从电网送到每一排机柜？

传统方案是UPS：电网交流电整流成直流给电池充电，再逆变回交流给机柜供电。电走了一个"交-直-交"的三角迷宫。HVDC绕过这个迷宫，电网交流电整流成高压直流，直接送到机柜，省去两次转换损耗，效率从92%提到98%。一个100MW数据中心一年下来，这就是几千万度电、几千万人民币的电费差距。中恒电气(002364)是这个赛道的中国龙头，HVDC产品已进入多个AI数据中心项目。科华数据(002335)横跨UPS、配电、制冷和运维，是国内少有的综合型供应商。

L3 电网级：电从哪里来

这是供电体系最根本的一层，也是最让人焦虑的一层。机柜供电方案可以迭代，机房配电可以升级，电网扩容量需要十年。

前面讲了，美国AI数据中心电网排队规模超过50GW，排队4到11年。这不是哪个智库的悲观预测，是Goldman Sachs把实际申报项目一个个数出来的结果。

微软的选择说明了一切。2025年，微软签下宾州三哩岛核电站的重启协议，20年PPA，835MW供电容量，美国能源部10亿美元专项贷款。三哩岛，1979年美国最严重核事故的发生地，AI公司让它的核反应堆重新启动。亚马逊买下宾州Susquehanna核电站旁960MW直连数据中心项目，Google和Kairos Power在签小型模块化核反应堆协议。AI公司从"电力用户"变成了"电力玩家"。

中国走了一条更聪明的路。

"东数西算"不是把东部数据中心搬到西部，是把西部便宜的绿电变成算力，再用光纤送回东部。内蒙古风电上网电价两到三毛一度，东部工业用电五到八毛。内蒙古有广袤土地、便宜风电、充足日照，天然具备承载超级数据中心的资源禀赋。

特高压是这条路的物理前提。没有特高压，"东数西算"无从谈起。中国过去二十年建成了全球最大规模的特高压电网网络。这是AI时代的隐性地基。建特高压时没人想到AI，但特高压建成后，AI是最大的受益者之一。

储能在这个语境里有了新角色：阳光电源(300274)的储能系统正在替代柴油发电机给数据中心做后备电源，宁德时代(300750)的储能电池也在进场。储能在这里不是削峰填谷，是给GPU集群当巨型BBU，断电20秒的损失可以追平一套储能系统的全生命周期成本。

这一层的核心张力很清楚。电力问题比芯片问题更难解决。芯片产能紧张，台积电开一条新产线3年。电网接入一个50GW级的排队列表，清空需要十年。两个维度的时间尺度不在一个数量级上。技术可以指数增长，物理基建只能线性铺设。AI的终极瓶颈不在光刻机，在输电线。

第⑥层：散热体系——当1000W遇上物理定律

2025年3月31日，3M宣布旗下Novec系列浸没式冷却液停止接单，2025年底前全面停产。3M Novec占全球浸没冷却液约80%份额，一个统治级玩家自己宣布退场，数千亿市场核心耗材的供应说停就停，供应链重塑窗口2到3年。

B200单卡功耗1000W之后，散热从配角变成了主角。不是技术偏好，是物理定律：一台8卡AI服务器GPU功耗8kW，一个40U标准机柜塞4到5台，整柜热负荷直奔60kW。风冷物理极限约30到40kW/机柜，空气热容太低，不是我们选液冷，是物理定律替我们选了液冷。

冷板式液冷：当前主力

冷板式液冷占AI服务器散热方案的70%以上。一块铝合金或铜制冷板紧贴GPU封装盖板，冷却液从微通道流过带走热量，升温后到CDU（冷量分配单元）交换给外部冷却塔，降温后再流回。循环简单，做好极难：冷板微通道加工精度要到微米级，几千个冷板在同一管路系统里，流量分配不能有一个偏。某个GPU的冷板流量偏了10%，温度比旁边高15度，寿命差距以年计。

全球冷板方案由欧洲Asetek、加拿大CoolIT主导，台系双鸿和奇鋐主导规模交付。英维克(002837)是中国液冷产业链位置最好的公司，CDU加冷板方案已进入Google等超大规模客户供应链，意义不亚于中际旭创当年进入英伟达。高澜股份(300499)从电网液冷起家转型AI服务器液冷，大功率液冷经验有了意想不到的用武之地。

浸没式液冷：最性感，最贵，最大变数

浸没式液冷更彻底，整台服务器泡在绝缘冷却液里。分两种：单相浸没靠泵循环，技术成熟；两相浸没靠芯片表面沸腾，散热效率更高但系统复杂度翻倍。优势是PUE可压到1.03以下，缺点则是贵：冷却液一桶价格是水的几百倍，机柜必须定制，服务器维修等于从液体里捞出来拆开。

3M退出让替代供给加速。索尔维、科慕等国际化工巨头在填充缺口，国产氟化液也在追赶。巨化股份(600160)、新宙邦(300037)、润禾材料(300727)三家是主力，国产份额从2023年的不到10%升到了2025年的30-40%。窗口期不长，如果2到3年内不能做到国际一线水平，3M空出来的份额大概率被欧美巨头接走。

3D VC均温板：最后一毫米

热从GPU die传到冷板，中间隔着一层界面材料。3D VC均温板解决这"最后一毫米"：封在铜壳内的真空腔体，工质液体在热点气化、冷端凝结，靠毛细力循环。等效导热率是纯铜的几十倍。台系双鸿和奇鋐全球领先，中石科技(300684)和飞荣达(300843)正在追赶，但3D VC微结构的精密焊接和工质填充是独门技艺，差距不是投钱就能缩短的。

中国液冷产业链的独特身位

把液冷拆成CDU、管路、冷板、冷却液、冷源五个环节，中国拥有全球最完整产业链。从英维克的CDU到高澜的冷板，从巨化、新宙邦的氟化液到格力、美的的冷源方案，每一环都有中国公司站上了牌桌。光模块强但DSP被卡，服务器强但GPU被卡，而液冷是全链条独立自主，在局部还有领先。

第⑦层：数据中心基础设施——不是地产，是精密仪器

AI数据中心不是盖房子。是造一台以"平方公里"为单位的超级计算机。

这个判断听起来夸张，但我们把一个万卡集群的BOM拆开来看。GPU 60%，网络设备 15%，供电和散热 12%，土建只有 8%，其他杂项 5%。土地和钢筋水泥，只占整个万卡集群建设成本的零头。真正烧钱的是设备，不是楼。

这意味着什么？评价一家AI数据中心公司，不该用地产商的逻辑，看地价、看出租率、看资产周转，那是衡量写字楼的方法。该用精密仪器制造商的逻辑：看功率密度，看PUE，看交付速度，看设备利用率。对标的不该是万科，是台积电。

选址：比造芯片更难的学问

传统数据中心选址看地价、电价、政策。AI数据中心加了三个硬约束：光纤延迟圈（推理延迟<1ms，数据中心离用户不超过100公里）、电力容量（200MW单点容量正在变成入场券）、散热水源（液冷需要稳定水源）。三个约束叠在一起，全球AI数据中心物理布局就被锁死了，北美集中在弗吉尼亚Ashburn、硅谷和凤凰城，欧洲锁在爱尔兰、荷兰和法兰克福，亚太集中在东京、新加坡和中国的西部能源基地。这些同样也是物理定律画出来的圈。

润泽科技：把数据中心做成了"算力地产"

A股数据中心公司里，润泽科技(300442)是规模最大的一家。

它的逻辑很清晰：拿地、拿能耗指标（能评）、建大规模数据中心园区、批发给云厂商和AI公司。目前运营容量750MW，2025年AIDC业务收入同比增长73%。海外规划了600MW容量，正在向外走。这是一个把"算力地产"模式跑通了的样本。

但润泽赚的不是地价差，而是电力容量和能耗指标的稀缺溢价。这门生意的本质是"先占坑"，坑的容量是电网和发改委画死的，后来者有钱也进不来。

数据中心A股的玩家不止润泽一家。数据港(603881)深度绑定阿里云，是定制型数据中心的标杆，运营容量超过500MW。万国数据(GDS)和世纪互联(VNET)在美股上市，是国内第三方数据中心的两大老牌劲旅，近年来也在向AI算力枢纽转型。这个赛道的共同特征是：重资产、慢回报、高壁垒，一旦建成了、租出去了，现金流极度稳定。但进入门槛也在快速抬高，核心不在于建设能力，而在于前述的能评指标和电力接入审批。

东数西算的真相

光环新网(300383)和奥飞数据(300738)是东数西算核心节点的代表性运营商。八大算力枢纽（京津冀、长三角、粤港澳、成渝、内蒙古、宁夏、甘肃、贵州）构成了一张覆盖全国的算力基础设施骨架。

东数西算不是把东部数据中心搬到西部。它的逻辑本质是：西部绿电变成算力，再用光纤和特高压送回东部。训练在西部（不care延迟），推理在东部（必须小于1毫秒）。这不是政策口号，是一道算术题，电价差乘以用电量，省出来的数字足够建一座新数据中心。

这个分工决定了未来中国AI算力基础设施的物理布局。不是一个选项，是一道物理加经济的必答题。

模块化与算力地产的未来

传统数据中心从拿地到交付需要2到3年，AI等不了。模块化数据中心把周期压缩到6到9个月，供电、制冷、机柜、消防全部工厂预制，现场拼装。中兴通讯和华为是核心推手。这个转型的深远含义是：建设壁垒在降低。靠"我能建"为护城河的公司壁垒在消融，未来竞争从"谁能建"转向"谁有能耗指标""谁有电力容量""谁有客户"。物理资源的稀缺，正在取代工程能力的稀缺。

Token工厂：数据中心的新身份

一个正在浮出水面的叙事是"Token工厂"：AI数据中心本质上不再是存放服务器的仓库，而是规模化生产token的制造工厂。工厂的核心KPI不是租金和出租率，而是单位电力产出多少token、单位时间创造多少AI产值。从这个角度，一家AI数据中心的真实对标不是万科，甚至不是台积电，是电厂，卖的不是空间，是算力和token。这一定位也将"算电协同"政策推到了台前：国家层面正在推动算力规划与电力规划统一布局，数据中心建在哪、电网扩容到哪，统筹决策，对中国AI基础设施的长期竞争格局影响深远。

第⑧层：算力平台与GPU云——英伟达想当军阀

这是八层天堑的最后一层。也是最精彩的一层。

前面七层解决了一个问题：把几万颗GPU拼成一台能用的超级计算机。但搭好之后，谁用它？怎么卖？

答案叫GPU云。把算力切成小时、月、年的租约，卖给需要训练或推理的公司。这件事听起来像AWS卖虚拟机，但底层逻辑完全不同。AWS卖的是通用算力，拼的是规模和多产品线。GPU云卖的是AI算力，拼的是谁手里有GPU。

而GPU是谁造的？英伟达。

这就是一切混乱的根源。

三种势力，三张牌

GPU云市场上有三股势力在互相撕咬。

第一股，正规军。AWS、Azure、Google Cloud。它们的牌是客户黏性。全球几百万家企业已经在它们的云上跑业务，顺手租GPU训练模型，这是最短的迁移路径。三巨头还有一张暗牌：自研芯片。AWS有Trainium，Google有TPU，微软有Maia。它们今天还在大量买英伟达GPU，但同时在写自己的替代方案。不是今年替代，是五年后的备手。

第二股，军火商兼军阀。英伟达自己的DGX Cloud。英伟达卖GPU给所有人，但它自己也下场做云服务。你从英伟达买的GPU，它用同样的GPU和你抢同一个客户。这是商业史上罕见的"上游吞噬下游"案例。DGX Cloud的筹码是GPU优先供应权和CUDA生态锁定。全球GPU缺货时，所有云厂商都在排队等英伟达发货。DGX Cloud不需要排队，它自己就是发货的人。DGX Cloud已签订的多年合同金额达到109亿美元。这不是小打小闹，是一个军火商宣布自己也要上战场。

第三股，游击队。CoreWeave从以太坊矿场起家，2022年底囤了数万张H100，靠GPU抵押融资、买更多GPU、再抵押，从矿场变成了AI云，市值一度超过600亿美元，2026年预期营收120到130亿美元。三方各有筹码：正规军有客户黏性，军火商有货源优势，游击队有先发囤货的时间差。谁都吞不掉谁，这是一个三方博弈的死局。

英伟达的两难

DGX Cloud是一个危险的游戏。左手，AWS、微软、Google每年买英伟达GPU的金额以百亿美元计，英伟达是它们的供应商。右手，DGX Cloud在抢这些云厂商的GPU客户，英伟达是它们的竞争对手。能同时当最大的供应商和直接的竞争对手多久？

云厂商的反制出奇一致：全部在自研芯片。AWS的Trainium 2已量产，Google的TPU v5p支撑Gemini训练，微软Maia 100开始内部部署。三巨头一边继续买英伟达GPU，一边悄悄把自己变成"有一天可能不再需要英伟达"的公司。英伟达想在食物链上往上爬，每往上爬一级，上一级的客户就变成下一级的对手，GPU制造全球独大，GPU云却没有客户服务基因，云服务不是硬件垄断可以平移的。

中国的独特变数

中国GPU云市场画出了完全不同的轨迹，最核心的差异只有一个：英伟达高端GPU进不来。H100、B200全部受限，中国AI云的底座必须建立在国产GPU上。

阿里云占据中国AI云约36%份额，策略是对冲：一边维持英伟达合规GPU（H20、A800）供应，一边加速接入寒武纪、海光等国产GPU。华为云走全栈自主路线，昇腾芯片加ModelArts开发平台，从芯片到框架全部自研。这个局面逼出一个战略问题：国产GPU加国产云平台，能否形成独立生态？

短期不太能。国产GPU的单卡性能、软件生态、大规模集群稳定性离英伟达体系还有差距。但长期来看，被迫隔离可能加速生态成熟，当一个市场被从全球供应链切出去，内部的供需配对会自己找到平衡。如果英伟达GPU一直进不来，中国的封闭生态反而可能比开放生态跑得快。封锁越严，替代越快。但替代成功的前提是：国产芯片和云平台在性能天花板被锁死之前，先跑通商业闭环。

收尾：中游的终局，下游的开场

八层天堑，已全部拆完。站远一步，看整体。

离芯片越近，护城河越深，玩家越少，但越隐形。NVLink只有英伟达能做，铜缆和PCB有几家中国公司站上了牌桌，光模块做到了全球第一但DSP被人掐着，到了GPU云已经三方撕咬。越往下游，玩家越多，利润越薄，市场越大。这些都不是偶然，离物理极限越近，能翻过墙的公司越少；离用户越近，市场越大，壁垒越薄。

上游的护城河来自"别人追不上"。台积电3nm良率、住友InP激光器工艺，不是我们多投钱就能追上。它需要我们坐上时光机回到二十年前，但我们回不去。中游的护城河来自"别人不敢换"。换光模块供应商要先停掉整个万卡集群，换液冷方案要重新做几千个冷板的流量调优。你敢不敢？"敢不敢"三个字，就是中游寡头的全部护城河。

两种护城河一样深。但中游寡头更隐形，AI模型跑在中际旭创的光模块上、靠着英维克的液冷、用着麦格米特的Power Shelf。它们是算力基础设施的"影子内阁"。看不见，但缺一个就翻车。

一颗芯片变成万卡集群，涉及上成百上千家供应商、成千上万名工程师。分工复杂到应该百花齐放，但规模效应走到极致是寡头垄断。每个技术环节跑完一轮洗牌，最终只剩两三家公司在收税。因为门槛太高，高到后来者爬不上来，在位者只要不出大错，护城河自动加宽。