英伟达GTC大会更新

2026-03-17 07:49:528℃

英伟达GTC大会更新

芯片相关：

1、Vera Rubin：每瓦性能比Blackwell提高10倍；

2、Groq 3（LPU芯片）：计划26Q3出货，三星代工；
1）单芯片参数
- 500 MB SRAM；
- 150 TB带宽；
- 1.2 PFlop算力；
2）8芯片方案
- 4GB SRAM；
- 1200 TB带宽，是Rubin的55x；
- 9.6PFlop（FP8下），Rubin是50 PFlop（FP4下）；
3）LPX机架：单机架256个LPU，置于Vera Rubin机架旁，Groq LPX可以将其Rubin GPU的每瓦Token处理性能提升35x；其中GPU用于高吞吐，LPU用于低延迟。
- 128GB SRAM；
- 40PB/s 带宽；
- 315 PFlop算力（FP8下）；
- 256颗芯片；
- scale-up带宽：640TB/s；
联合计算：通过英伟达Dynamo计算架构，Vera Rubin NVL72和Groq 3 LPX机柜联合计算，Vera Rubin负责Perfill和Decode ATTN阶段，Groq 3 LPX负责Decode FFN阶段。根据英伟达披露数据，随着TPS/单用户的提升，TPS/MW（单MW每秒Token吞吐量快速下降），再加入LPU联合计算后，在高TPS/单用户环节，Rubin NVL72的TPS/MW是Blackwell NVL72的35倍。

3、Kyber原型机：预计27年发货，为Vera Rubin Ultra的下一代机架级系统，仍属于Rubin系列，单托盘144颗GPU，计算托盘以垂直而非水平放置，以提高密度并降低延迟。

[礼物]其他
1、DLSS 5：由AI驱动，用于游戏的超分辨率，计划今年秋季推出。
2、Token King：老黄认为，英伟达拥有全球最低的单Token成本，是Token之王。
3、AI推理的拐点已经到来：云厂商的算力部署大约占到整体算力总需求的60%，剩下的是区域云、主权云、企业、工业、机器人、边缘计算等
1）强调Token/watt、Token价格
2）GB300 Performance/Watt比竞争对手好50x；相比于H200 NVL8，GB300 NVL72的Token成本降低30x；
4、Vera CPU：用于处理Agentic AI任务，比传统CPU速度快50%。
5、太空算力：英伟达和合作伙伴正在研发一台用于太空的服务器，称其为Vera Rubin Space-1，最大的问题在于太空散热（太空中没有热传导、没有对流）。
6、Olaf机器人：英伟达和迪士尼正在制造一台Olaf机器人。
7、宣布NemoClaw参考栈：一个针对OpenClaw Agent平台的堆栈，用于创建AI Agent，其使用Nvidia AI Agent Toolkit去优化OpenClaw，安装用于开源模型的OpenShell和沙盒。
8、预计其Blackwell和Rubin产品，到2027年底，累计创造1万亿美金收入。25年10月，预估为5000亿美金，26年2月电话会，CFO上调预期，会超过先前的估算。

作者声明：本文转载自第三方，旨在提供资讯参考，并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日，作者与文中提及的标的不存在持仓关系。

标签: 机器人游戏芯片英伟达边缘计算

合规声明：本站发布的所有文章及观点均系个人研究共享，投资心得交流，不代表本站立场，且不构成任何形式的投资建议。投资者据此操作，风险自担，请务必保持独立审慎的决策态度。

本文链接：https://www.sanhuba.cn/post/2b-5c-6151.html

上一篇黄仁勋GTC演讲核心要点总结：旨在构建一个垂直整合的AI计算帝国

下一篇太空算力建设的未来前景与能源支撑研究

英伟达GTC大会更新

机器人相关

栏目分类

游戏相关

芯片相关

用户须知

英伟达GTC大会更新

 机器人相关

 栏目分类

 游戏相关

 芯片相关

用户须知

机器人相关

栏目分类

游戏相关

芯片相关

用户须知