凌晨见!英伟达或祭出“王炸”Rubin架构,10倍推理性能背后暗藏HBM4与光互联新局

2026-03-16 12:06:162


随着凌晨GTC大会帷幕的即将拉开,科技界的目光已全部聚焦于那个穿着皮衣的身影——黄仁勋。尽管具体的发布细节仍笼罩在一层神秘的面纱之下,但根据目前泄露的风向与行业共识,老黄极有可能在台上为我们将Vera Rubin架构(计划于2026年下半年量产)的宏伟蓝图徐徐展开。这不仅是一次常规的产品迭代,更像是一场关于“算力极限”的豪赌。据推测,这一新架构的核心杀手锏在于将全面搭载HBM4存储,旨在将推理性能较当前的Blackwell平台提升10倍,以此应对未来万亿参数模型的严苛需求。
HBM4与光学互联的双重保险
在AI大模型的训练与推理过程中,内存带宽往往成为制约性能的“天花板”。市场普遍预期,Vera Rubin架构的重头戏将是HBM4的首次大规模商用。相较于HBM3e,HBM4不仅在堆叠层数与接口位宽上实现翻倍,更通过全新的1c DRAM工艺与TSV技术,为GPU核心提供前所未有的数据吞吐能力。这或许是老黄敢于宣称实现10倍推理性能跃升的底气所在。


然而,单纯堆砌内存带宽并不足以支撑吉瓦级(gigawatt-scale)算力中心的运转,功耗与信号完整性成为另一大难关。因此,除了芯片本身的升级,业界猜测老黄极有可能在现场展示NVLink-CPO(共封装光学)交换机技术。这项黑科技旨在通过光学互联取代传统的铜缆,彻底打破长距离数据传输的功耗墙,让数万颗Rubin芯片能够像一颗“超级巨芯”那样协同工作。这不仅是技术的展示,更是英伟达构建下一代AI工厂基础设施的关键落子。


具身智能:GR00T N1.6与机器人的“长思维链”
如果说Vera Rubin架构是为AI提供了“大脑”的算力基础,那么Project GR00T(通用基础机器人技术)系列模型则是赋予机器“灵魂”的关键。据透露,本次大会的一大看点可能是发布GR00T N1.6基础模型,并进行现场实机演示。


届时,我们或许将见证人形机器人在“长上下文”能力加持下的惊艳表现。这意味着机器人不再只是执行预设的简单指令,而是能够像人类一样,基于长时间的观察与理解,自主拆解复杂任务、处理未曾见过的场景。当拥有10倍推理能力的Rubin架构遇上具备长思维链的GR00T模型,英伟达所描绘的“物理AI”时代或许将从概念照进现实。


在这场即将开启的技术盛宴中,无论是Vera Rubin架构对算力瓶颈的暴力破解,还是GR00T模型对机器人自主性的重新定义,都预示着AI正从“云端的幻觉”走向“实体的智能”。虽然最终的细节仍需等待老黄在凌晨的舞台上亲自揭晓,但可以确定的是,这场变革将再次刷新我们对技术边界的认知。
兴森科技(002436): 如果老黄宣布 HBM4 采用 12 层或 16 层堆叠,这将极大增加载板的布线密度。这对 兴森科技(FCBGA 高阶载板)是 Z1 级的重大利好,因为更高的层数意味着更强的技术壁垒和更高的单价。
法尔胜中际旭创:关注是否发布支持 1.6T 速率 的 Spectrum-6 光电共封装交换机。只要老黄展示光学互联对功耗的降低(传闻可降低 5x 网络功耗),A 股光通信板块的 $R$ 值将直接突破前高。
锋龙股份:优必选是是N1.6模型重要的落地合作伙伴。
中科创达:英伟达的长期合作伙伴,拥有 ISP Tuning 中国独家授权,其 RobotOS 系统已适配超 20 款机器人,将深度受益于 Thor 平台的软件适配需求。
协创数据:深度整合了 NVIDIA Isaac Sim 与 GR00T 技术栈,为机器人应用场景提供端到端开发支持。
天准科技:英伟达 Elite 级合作伙伴,基于 Thor 开发的“星智”控制器已获得智元机器人千万级订单,是硬核技术变现的典范。


作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。

合规声明:本站发布的所有文章及观点均系个人研究共享,投资心得交流,不代表本站立场,且不构成任何形式的投资建议。投资者据此操作,风险自担,请务必保持独立审慎的决策态度。