新技术,锐捷网络助力提升15%GPU算力,减少三分之一光模块。

2026-05-24 18:12:371
背景:从千卡到万卡,算力规模的跃升支撑了大模型从 GPT-4 到 DeepSeek V4、GLM-5 的一路狂飙。不过我们都忽略了一个现实,在 GPU 硬件规模达到一定程度的时候,将算力相连的链路就成了不能忽视的性能变量。


事件:智谱率先在 GLM-5.1 线上生产集群中完成了新一代组网架构 ZCube 的规模化落地。(ZCube是智谱、驭驯网络与清华大学在网络领域会议ACM SIGCOMM2025上发表的网络架构)

这是该技术首次大规模运用于生产推理集群中,智谱联合驭驯网络与负责网络架构升级和优化工作,组网架构优化基于锐捷网络交换机。






效果:新一代组网架构下,在不新增任何 GPU、不修改任何应用代码的前提下,集群推理吞吐提升了 15%(不加一块GPU,算力瞬间多出15%),首 Token 响应的尾延迟(TTFT P99)下降了 40.6%,交换机与光模块硬件成本减少了三分之一。或许,在扩大 GPU 规模之外:网络,已经成为超大规模 AI 基础设施的下一个主战场。




几乎在同一时期,OpenAI联合NVIDIA、AMD、Intel、Microsoft、Broadcom等五大巨头发布了MRC协议,并已部署于其最大规模超算集群。两大领先模型厂商同时动作,共同印证了网络已成为超大规模AI基础设施竞争的新战场。



在 GPU 价格高企、算力供给偏紧的大环境下,多数公司的注意力仍然集中在「如何获得更多 GPU」上。但 ZCube 用真实的生产数据证明,在 GPU 资源不变的前提下,纯粹通过网络架构升级就能释放 15% 的额外算力,同时节省三分之一的网络成本。如果将这一比例外推到万卡甚至十万卡规模,网络优化所释放的价值将远超一般认知。


AI 算力竞赛的下半场,胜负可能取决于那张「看不见的网」。

作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。

标签: DeepSeek化工

合规声明:本站发布的所有文章及观点均系个人研究共享,投资心得交流,不代表本站立场,且不构成任何形式的投资建议。投资者据此操作,风险自担,请务必保持独立审慎的决策态度。