别光站在这里,要站在光里系列之OCS光交换机

2026-05-11 22:34:063

最近AI圈的朋友可能频繁刷到一个新词:OCS(光电路交换机)。作为支撑百万卡AI集群互联的核心技术,它正从谷歌的“内部实验”走向全行业规模化落地。很多朋友可能听过光模块、CPO,但对OCS还很陌生,今天我给大家分析一下:它为什么是AI时代的“必选项”,技术难在哪,我们能关注哪些机会。
一、先搞懂行业背景:为什么AI非用OCS不可?
咱们先回忆下AI大模型训练的痛点:现在大模型动辄用几万、几十万张GPU/TPU协同计算,相当于几万人要同时配合干活,彼此之间传数据的“路”要是堵了、慢了,整个训练效率都会卡壳。
传统的数据中心网络用的是电交换机:数据到了交换机要先“光电转换”(把光信号转成电信号读地址),转完再转回光信号发出去,就像快递到了中转站,要先拆包、扫码、再重新打包,既费时间(延迟高)又费电(功耗大)。而且电交换机的带宽受限于芯片速率,现在224G SerDes已经快到物理极限了,再往上提难上加难。
而OCS是全光交换:不用拆包、不用中转,直接在光路上通过“折射/偏转”把信号送到目标端口,相当于给数据修了条“点对点直达轨道”,光速传输不绕路。这种特性刚好踩中了AI网络的三大需求:
- 低延迟:只有10-100纳秒,是传统电交换机的1/100,几万张卡协同训练时,每少1微秒延迟都能省几十万美金的算力成本;
- 低功耗:只有同等带宽电交换机的1/5,谷歌实测用OCS能给AI集群降40%功耗、省30%建设成本;
- 高兼容:不用跟着电芯片的速率迭代,不管未来光模块升级到1.6T还是3.2T,OCS都能无缝适配,硬件寿命直接拉长3-5年。
现在OCS已经从谷歌的TPU集群走向全行业:2025年全球OCS市场才4亿美元,到2029年预计超25亿美元,4年复合增速58%,妥妥的高成长赛道。除了谷歌2026年就要15000台300端口OCS,微软、Meta、英伟达都在测试,英伟达甚至把OCS放进下一代Dragonfly架构,用来做跨机柜、跨集群的全光交换——行业已经到了放量临界点。
二、OCS的4种技术路线,各有各的“用武之地”
现在行业里OCS主要有4种技术路线,没有绝对的优劣,只是适配不同场景:
1. MEMS(微机电)路线:现在的主流,市场占比超70%。原理是在硅片上做一排微米级的微小镜子,通过电压控制镜子角度,把输入的光反射到目标端口。优势是技术最成熟、能支持大端口数(现在最多能做到512端口),成本是几个路线里最友好的,谷歌、Lumentum都是走的这个路线,国内的光迅科技太辰光也布局了相关产品。
2. 数字液晶(DLC)路线:没有机械运动部件,靠电场改变液晶的折射率来偏转光路。优势是可靠性高、驱动电压不到10V,适合对稳定性要求极高的场景(比如海底光缆、金融数据中心),缺点是切换速度慢(要100毫秒),代表厂商是Coherent,国内的光库科技在做相关布局。
3. 直接光束偏转(DLBS/压电陶瓷)路线:利用压电陶瓷通电会变形的特性,带动光纤准直器动,直接对准目标端口。优势是光传输损耗低,缺点是端口数做不大,适合小规模场景,代表厂商是Polatis,国内的凌云光是Polatis的核心代工厂,占其60%-70%的代工份额。
4. 硅光(SiPh)路线:未来的发展方向,直接在硅芯片上做光波导,光在芯片里的预设路径走,切换速度能到微秒甚至纳秒级。现在的问题是光损耗高、多通道容易串扰,还没大规模商用,国内的中际旭创子公司TeraHop、Taclink都在研发硅光OCS产品。
简单总结:现在赚钱的主要是MEMS路线,未来硅光潜力最大,其他路线各有细分场景,不存在谁完全替代谁。
三、OCS的技术壁垒:为什么国内厂商之前做不出来?
别看现在国内厂商纷纷发布OCS产品,其实这个领域的技术壁垒非常高,主要集中在三个环节:
1. 核心器件卡脖子:OCS成本里占比最高的是MEMS微镜阵列、光纤准直器阵列、透镜阵列这些核心部件,尤其是MEMS微镜,要在硅片上做几百个能精准控制角度的微米级镜子,工艺难度极高,之前只有海外的Silex、Lumentum能量产,国内厂商大多是采购海外核心器件做组装,缺乏自研能力。
2. 系统集成难度大:OCS不是把器件拼起来就行,还要解决插入损耗(光经过OCS的信号衰减)、端口密度、可靠性这些问题。比如现在主流OCS插入损耗要控制在3dB以内,端口密度要匹配AI集群的高密度布线,还要做到故障自动切换、热插拔,这些都需要长时间的工艺积累,不是短期能追上的。
3. 和AI系统的协同设计:OCS不是独立设备,要和客户的AI集群网络架构适配,比如谷歌的3D Torus拓扑、英伟达的Dragonfly架构,都需要OCS厂商和客户联合调试,没有长期合作经验根本拿不到订单。
现在行业急需解决的问题也集中在这些壁垒上:一是要把MEMS微镜、硅光芯片这些核心器件的良率提上来,把成本降下去;二是要解决大端口数的集成问题,适配未来百万卡级AI集群的需求;三是要提升切换速度,现在MEMS切换要25毫秒,压电陶瓷要几毫秒,还不适合频繁调整的场景,需要进一步优化。
四、OCS和CPO、可插拔光模块啥关系?会不会互相打架?
很多朋友会混淆这三个,其实它们是互补的,各管各的“地盘”,就像马路上的小轿车、货车、公交车,各有各的用途:
- 可插拔光模块:就是咱们现在常用的那种插在交换机上的光模块,短期还是Scale-out(横向扩展,多节点协同)网络的主流,技术最成熟,国内中际旭创新易盛都是这个领域的龙头。
- CPO(共封装光学):把光引擎和交换芯片封装在一起,适合Scale-up(单节点强化,比如机柜里GPU/TPU互联)的高密度场景,功耗比传统方案低5-6倍,现在正在爬坡量产。
- OCS:负责拓扑重构、Spine层(网络核心层)、跨数据中心互联,相当于给整个网络做“动态调度”,和CPO搭配用效果最好——实测传统可插拔方案功耗83pJ/bit,CPO+OCS组合能降到31pJ/bit,直接省2.6倍功耗。
五、国内厂商有哪些机会?
OCS产业链上游是核心器件(MEMS微镜、光纤阵列、透镜这些),中游是整机厂,下游是谷歌、英伟达这些云厂商,国内厂商的机会主要在两个方向:
1. 核心器件龙头:比如做MEMS代工的赛微电子,它的瑞典子公司Silex是全球顶尖MEMS代工厂,2023年就开始量产OCS用MEMS,北京Fab3也已经启动小批量试产;做精密光学元件的腾景科技天孚通信,是OCS光纤阵列、透镜阵列的核心供应商;做MEMS微振镜的英唐智控,收购桂林光隆之后布局OCS全制程,128通道OCS预计2026年就能量产。
2. 整机/OEM厂商:中际旭创的子公司TeraHop已经展出64x64硅光OCS,还在给海外客户送样;光迅科技在OFC 2026展出了320x320端口的MEMS OCS,是国内整机进展最快的厂商之一;德科立的硅基OCS已经拿到海外样品订单;凌云光绑定Polatis,占谷歌OCS代工份额的10%左右,2026年相关收入预计能到十亿级人民币。
风险
1. 现在OCS还在放量前期,谷歌之外的大厂测试进度可能不及预期,要是AI算力需求降温,整个产业链都会受影响;
2. 技术迭代风险,要是硅光路线突然突破,现在做MEMS的厂商可能面临技术替代;
3. 价格战风险,国内厂商一旦扎堆进入,可能会打价格战,影响利润;
4. 地缘政治风险,海外大厂可能限制核心器件出口,影响国内厂商的 supply chain。
总结一下:OCS不是短期炒作的概念,是AI算力集群规模扩张的“刚需配套”,长期逻辑很顺,但短期波动肯定有,大家可以根据自己的风险偏好,关注有核心技术、已经绑定大客户的标的,别追高哦~
(注:以上内容仅为行业科普,不构成投资建议,股市有风险,投资需谨慎)

作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。

合规声明:本站发布的所有文章及观点均系个人研究共享,投资心得交流,不代表本站立场,且不构成任何形式的投资建议。投资者据此操作,风险自担,请务必保持独立审慎的决策态度。