🌟#V4论文重点强调了超节点是必选项。
V4论文中提到对于硬件架构设计的指引,C/B≤2d=6144 FLOPs/byte,指的每GBps带宽可支持最大6.1TFLOPs的算力不受到带宽限制,实现算力的高效利用。
随单卡算力的提升,下一代高端国产卡通过scale-out很难维持这一比例,系统会快速落入带宽受限区间,将造成算力浪费。
要把算力重新拉回有效利用区间,只能通过更高带宽密度的Scale-up实现,算力与带宽必须同步提升,超节点因此成为确定性方向,而不是可选优化。
🌟#V4与昇腾的适配验证了超节点是工程上的最优解。
推理端:基于DeepSeek V4-Pro模型,在8K输入场景,昇腾950超节点可实现TPOT约20ms时单卡Decode 吞吐4700TPS。
训练端:基于Atlas 800 A3风冷超节点、Atlas 900 A3 SuperPoD液冷超节点,DeepSeek-V4-Flash模型已实现高性能训练复现。
证明了超节点在训练与推理端都达到最优状态。
🌟
超节点市场空间怎么看?
若假设26-28年国产卡整体出货量为290/500/792w张,超节点渗透率分别为27%/40%/50%,单台(以128卡为例)价值量为2000w,机柜总体市场空间为1223/2969/5569e,远期则是万亿市场。
重视#国产Switch芯片的渗透放量、#服务器机柜厂商利润率提升、#224G高速连接器空间的成长性。
1、Switch:盛科通信
2、服务器机柜:浪潮信息、华勤技术、紫光股份、中科曙光
3、高速连接器:华丰科技、航天电器
欢迎联系
作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。