一文看懂谷歌新TPU,“连接”用量增加,日本地震影响日东纺T布供给

2026-04-23 15:38:141
1️⃣Gtc开完后,所有人都在“兑现”,甚至有人因为下跌,就强行解读Gtc为“不及预期”,我们是极少数坚定“戒掉博弈,关注产业趋势”的,今天也是一样!
2️⃣国产算力的投资抓手:芯光武器(芯原+海光+寒武纪+航天电器)。芯片在放量,在出业绩,类似于光模块。Agent打开ai应用想象力天花板,国产模型迭代且加快适配国产算力,国产芯片努力追赶进入1-10放量阶段。
一文看懂谷歌新TPU
一、TPU 8T:大规模训练专用芯片
(1)Scale up:
拓扑架构:沿用升级版3D Torus环形拓扑,优化芯片间直连链路;
规模上限:单SuperPod超节点从9216颗芯片扩容至9600颗,共享内存池达2PB;
带宽升级:芯片间ICI互联带宽提升2倍。
(2)Scale out:
网络架构:全新Virgo两层无阻塞扁平化网络,替代前代拓扑;
带宽升级:单芯片横向扩展带宽从100Gbps跃升至400Gbps,整体数据中心网络带宽提升4倍;
规模上限:单数据中心可连接13.4万颗TPU,跨多站点可扩展至百万级TPU集群。
(3)TPU 8T 光模块配比
Scale up:配比保持不变,沿用前代光模块互联逻辑,依托3D Torus高带宽直连,无需额外增加域内光模块;
Scale out:配比直接翻倍(单芯片横向带宽从100G→400G,带宽提升4倍,需配套更高规格光模块(800G→1.6T迭代)(Virgo扁平化网络需更多光链路支撑无阻塞互联,光模块数量随带宽、集群规模同步扩容);
(4)TPU 8T 液冷升级:全液冷,全浸没式+CDU集中液冷架构升级
二、TPU 8I:低延迟推理专用芯片
(1)Scale up
拓扑架构:全新分层Boardfly专属拓扑(推理定制化),4颗TPU组成1个BB单元,8个BB通过铜线组成Group,36个Group经OCS互联;
规模上限:单SuperPod超节点从256颗芯片跃升至1152颗,FP8算力提升8.67倍、HBM容量提升5.74倍;
网络优化:网络直径从16跳降至7跳,大幅降低MoE模型专家路由、推理数据转发时延,适配低延迟推理核心需求。
(2)Scale out
网络架构:基于Boardfly拓扑延伸,搭配OCS光路交换做动态链路重构
(3)TPU 8I 光模块配比
Scale up:配比变为1:1.25;
Scale out:OCS用量显著增加。
(4)液冷架构变化:全液冷,分区浸没式+模块化液冷架构+CDU分区设计,按Boardfly Group做独立液冷分区。
相关公司:
光模块&光芯片:中际旭创新易盛源杰科技长芯博创
OCS:腾景科技炬光科技光库科技赛微电子
液冷:英维克
Cpo/Ocs板块:最大化用光=最大化Token利润
谷歌首次把训练与推理拆分至独立芯片:8t训练,Virgo结构;8i推理,是最大变化,用全新Boardfly架构+CAE+大SRAM,大幅降低延迟。
先上结论:实质性利好光。
证明Agentic Ai时代,不仅Gpu,还有Tpu,不仅训练,还有推理,都遵循Token经济学,用更多光提高单Token收益,即更高速度(=更高收入)、更低功耗(=更低成本)。
1️⃣Boardfly架构是怎样的?
4个Tpu用Pcb板组成1个Tray,8个Tray用铜缆组成1个Group,36个Group用Ocs交换机组成1个Pod(集群)。
2️⃣为什么8i从Torus环⾯拓扑,转向Boardfly?
本质是模型从稠密的LLM👉稀疏的MoE。
LLM的通信像地铁(路线固定、班次密集、吞吐大),适合棋盘格一样的Torus架构;MoE的通信像网约车(每单随机、起点终点任意),token独立选择专家,数据瞬间需要芯片间“all to all”交流,对单次互连的时延要求极高。
Boardfly通过增加节点数(即增加直连光链路),把“多跳(需路过的路口数)”的路径“拍扁”成“少跳”。1024芯片,网络直径从16跳降低至7跳,网络直径-56%,推理场景性价比提升 80%。
光的三个关键词:测试、耦合、连接,适用于各种光,Cpo/Ocs/Oio等等…。
标的:【罗博特科】:G的Ocs交换机整线设备(含测试和耦合设备)、【致尚科技】:G的sn-mt连接器代工。
谷歌推出TPU 8t&8i,“连接”用量增加
核心要点:谷歌架构的升级凸显了“连接”的重要性。随着TPU向V8、V9迭代,其网络带宽持续扩张、超节点规模不断扩大,带动光模块配比提升、OCS应用场景打开,利好谷歌链中际旭创/长芯博创/光库科技/腾景科技
1️⃣训练芯片TPU8t:更大集群、更高带宽。Scale Out侧采用全新的两层无阻塞Virgo网络,带宽提升4倍;Scale Up侧沿用3D Tours结构,芯片间ICI互联带宽提升2倍,超节点域扩大至9600芯片。带宽提升带动光模块用量提升,如果考虑到光模块从800G迭代到1.6T,ScaleUp域配比不变+ScaleOut域配比翻倍。Front-end网络采用Jupiter架构,连接存储及CPU新增OCS用量
2️⃣推理芯片TPU8i:侧重更短的网络直径跳数、时延更低。Scale Up侧采用全新的分层式Boardfly拓扑结构,4个TPU组成一个BB,8个BB通过铜线组成一个Group,36个Group通过OCS连接成1152卡的超节点,网络直径从16跳减少到仅7跳,适配大型MoE模型的低延迟目标。根据我们的计算Scale Up域光模块配比为1:1.25,同时增加OCS连接
谷歌链的高敞口标的中际旭创 (光模块/NPO绝对大份额、OCS储备)、长芯博创 (MPO/AoC)、光库科技 (OCS准直阵列)、腾景科技 (OCS晶体材料+准直阵列)
谷歌TPU方案利好二代布+hvlp4/载体铜箔,日本地震日东纺T布供给受影响
1,日本地震日东纺T布供给受影响。日本东北部7.7级地震,福岛周边多家工厂生产受波及,公告停产时间在4-8周。日东纺特种电子布生产集中在日本福岛和中国台湾,预计短期生产受阻,T布紧缺程度进一步加剧。
2,Q布很好、但这次还不是Q布,二代布标的【复材】【中材】【宏和】
1️⃣谷歌有什么产品可能用到Q布:MPU 有可能性
①V8(zebra/sun fish),不用,Q2以来谷歌向台光/松下加单的主力产品,搭配为M8+二代布。
②V8E/V9,不用。27H1量产搭配为M9+二代布。
③MPU,有可能,(用于推理,对标LPU)对应PCB板子,芯片设计前期为联发科、测试搭配M9+Q布,目前方案设计还未最终定型,需要继续跟踪。
2️⃣ 26年Q布可以期待什么:
①LPU打样,目前存在多种搭配(M9+Q/M9+二代布/M8+二代布),但NV主流导向还是偏向于M9+Q。
②CoWoP,Q布同时具备Low-Dk和Low-CTE性能,可能是类载板的优选。
③M10打样进展,目前主流打样方案为M10+第二代Q布。
3️⃣26年估计Q布以打样需求为主,27年放量,维持前期27年5000万米市场空间判断(LPU成为明确增量),对应100E+市场空间,40E+市场利润体量。
3,铜箔继续:谷歌带来HVLP4+光的双重增量,综合性标的【铜冠】、德福,单吊载体【方邦】
1️⃣HVLP4是铜箔板块Q2最明确的边际变化:谷歌V8在台光明确使用HVLP4铜箔,Q2放量在即,目前HVLP4海外加工费在22万元/吨、单吨净利12万元,300吨/月即对应3600万元/月的增量,单季度增量超1E。预计26H2时点HVLP4需求达2200吨/月。
2️⃣谷歌MPU设计预计将大幅拉动光模块需求,昨天我们测算27年光模块带来载体铜箔20E市场空间增量,后续增量可能超预期。

液冷板块更新:谷歌TPU v8推出,维谛业绩超预期

1、谷歌于Cloud Next大会上宣布,新一代TPU V8芯片将全面采用液冷散热方案。V8单芯片功耗达1300W,较前代V7的980W提升30%,液冷价值量有望持续提升。

2、Vertiv发布2026Q1财报,实现营收26.5亿美元,yoy+30%,超出公司指引的26亿美元;营运利润率20.8%,yoy+4.3pct,较公司指引高1.8pcts。预计全年收入135-140亿美元(上修2.5亿美元)。

相关标的:英维克申菱环境鸿日达

作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。

合规声明:本站发布的所有文章及观点均系个人研究共享,投资心得交流,不代表本站立场,且不构成任何形式的投资建议。投资者据此操作,风险自担,请务必保持独立审慎的决策态度。