HBM涨价可能持续到2027年,一文重新看懂三大存储巨头

2026-04-26 12:01:407




4月下旬,A股存储芯片板块的交易情绪明显升温。协创数据一季度业绩预告显示归母净利润6.5亿至8.5亿元,同比增长284%至402%。佰维存储一季度营收68.14亿元,同比增长341.53%,归母净利润28.99亿元,单季盈利远超去年全年。香农芯创一季度归母净利润13.27亿元,同比增长7835.06%。这些公司一季度利润大幅增长,直接原因是DRAM和HBM价格同步上涨。DRAM合约价一季度涨了90%到95%,HBM合约价涨了50%到55%。涨价能到这个幅度,是因为SK海力士、三星和美光牢牢掌控着HBM的供给,SK海力士2026年全年的HBM产能已经被客户全部订完。理解这三家的竞争,需要先搞明白两个基础问题,HBM到底是什么,为什么AI芯片离不开它。以及为什么HBM的供给很难在短期内放量。下面先讲清楚这两点,再来看三家各自的竞争位置和技术路线。文末有个人的一些浅见,仅供参考。

一、AI运行需要的数据分层



存储芯片的种类很多,各自承担的工作不同。为了理解当前存储行业的变动,需要先知道在AI数据中心里,不同类型的数据分别放在什么位置。



大模型在运行时产生的数据,按照被调用的频次可以分成三层。最常用的一层叫热数据,包括模型的核心运行参数,以及用户正在实时对话时产生的上下文记录。这部分数据对读写速度要求极高,任何延迟都会导致计算芯片等待。热数据绝大部分存放在HBM里,极少部分最核心的指令放在SRAM里。SRAM读写速度极快,电路结构不需要像DRAM那样定期刷新,但它占据的芯片面积很大,成本极高,所以只能用作容量极小的高速缓存。



第二层是温数据。用户如果开启了一个对话窗口但中途去处理其他事情,这段暂时挂起的记录就会从昂贵的HBM迁移出去,下放到普通的DRAM或者企业级固态硬盘里暂存,等用户回来后需要调用时再拉回来。DRAM是计算机和手机里最常见的系统内存,它用一个电容来储存电荷,电容充满电代表1,电放完了代表0。因为电容会自然漏电,所以必须定期刷新才能维持数据不丢失。根据应用场景的不同,DRAM又分化出了针对电脑内存的DDR、针对手机低功耗需求的LPDDR、以及针对显卡高带宽需求的GDDR。





第三层是冷数据,比如半年前的聊天记录备份,或者AI训练用的原始语料库。这些数据极少被访问,存放在NAND闪存或机械硬盘里。NAND闪存断电后数据不会丢失,通过把存储单元像盖楼一样垂直堆叠,可以在很小的芯片面积内实现极高的存储容量。NAND闪存通过3D堆叠技术已经做到超过200层,能在很小的芯片面积内实现很大的存储容量。同时借助每个存储单元存放多位数据的技术,单位存储成本被压得很低。





大模型在实际运行时,这套分层体系面临着一个突出的压力点。当大语言模型与用户对话时,它需要记住用户之前说过的话。为了避免每次回答都把整段聊天记录从头到尾重新算一遍,模型会把处理过的历史对话压缩成一组特征值保存下来,这种“用空间换时间”的临时数据叫做键值缓存。假设系统记录了一百万个词元的历史对话,当前真正活跃的窗口是十万个词元。那过去的九十万个词元就退化为普通的文本日志,安静地存放在NAND硬盘里,系统在回答今天的问题时根本不会去读取它们。但当前这十万个活跃词元,会被实时转化为庞大的键值缓存,直接装进计算卡旁边的HBM里。模型需要针对这部分数据进行高频率的来回读写,因此HBM的带宽直接决定了模型输出的速度。二、HBM的物理结构与工作原理



HBM的全称是高带宽内存。它的工作原理是把多个DRAM裸片像盖楼一样垂直堆叠在一起,层与层之间通过硅通孔技术连接。这种结构像是从平房变成了摩天楼,数据传输的距离大幅缩短,同时容量可以在同一块封装面积内成倍增加。由于HBM紧邻GPU等逻辑芯片进行封装,数据的物理传输路径比传统插在主板上的内存条短得多,因此功耗也更低。每一代AI芯片的升级,HBM的规格都在同步提高。英伟达从H100升级到H200,再到B200和B300,HBM的容量和带宽持续增加。从H100到H200,HBM容量提升了50%。从B200到B300也是同样的比例。而下一代Rubin平台到Rubin Ultra,HBM容量将提升4倍。这是因为每一代芯片算力越强,需要等待数据的时间占比就越大,内存带宽越不够用。大模型之所以对HBM依赖极深,和它的底层架构有关。Transformer模型中的注意力机制需要计算所有输入词元两两之间的关系,内存需求与序列长度的平方成正比。Transformer架构图:





模型参数越庞大,对话上下文越长,HBM的容量和带宽需求就越陡峭。无论是训练时的参数迭代,还是推理时的键值缓存反复读写,系统性能往往不取决于芯片算力有多高,取决于数据能不能跟得上。这种“内存墙”的限制,是HBM从边缘角色变成核心战略资产的原因。三、供给跟不上需求



HBM的生产难度在存储芯片里属于最高一档。生产同等容量的HBM,消耗的晶圆面积大约是标准DDR5内存的三倍。这意味着一部分设备去生产HBM,传统内存的产出就会相应减少,行业内把这种现象叫做产能挤占。除了消耗面积大,HBM的制造流程也比传统内存复杂得多。每一层DRAM芯片堆叠上去之前都需要打磨到极薄,然后打出数千个微米级的垂直通孔,最后通过热压键合把层层芯片精确对齐并焊死。这套工序的良率会随着堆叠层数增加而急剧下降。如果单层芯片的良率是95%,堆叠8层后整体良率会降到66%,堆叠16层则只剩44%。这是假设单层良率非常理想的情况,实际制造中良率波动会更大。再加上硅通孔先进封装和无尘室的建设周期通常以年为单位计算,物理产能的扩张速度远远跟不上AI算力基础设施的膨胀速度。供给端受限,需求端又是另一番景象。HBM的客户已经从此前的个人电脑和手机厂商变成了大型云服务提供商,后者对AI算力的投入更急迫,对HBM的性能敏感度远高于价格敏感度。HBM的性能直接决定了GPU集群的利用率,因此下游客户愿意为性能付高价。



2026年第一季度,HBM的综合平均合约价环比暴涨了50%至55%。在下一代HBM4产品的定价谈判中,SK海力士向英伟达供应的单价已经确认约为560美元,比当前供应的HBM3E合约价370美元高出50%以上。SK海力士和美光的最新财报都确认,2026年全年的HBM产能已经全部售罄,价格也在与头部客户的合同中被锁定。由于供需缺口在短期内无法弥合,东北证券预计HBM涨价可能持续到2027年。为了应对这种长期供应偏紧的局面,三大存储巨头纷纷与核心客户签订长期协议。SK海力士已基本敲定与微软和谷歌的三年期供应合同,合同内容包含最低保底价格以及合同总额10%至30%的预付款。美光也与战略客户签下首个五年期协议。这种锁定产能和价格的长期合同在存储行业并不常见,背后是因为扩产所需的资本支出规模巨大,存储器厂商需要高可见性的订单来支撑投资决策。四、三家的竞争



全球HBM市场只有三家供应商。SK海力士、三星和美光。截至2025年第三季度,SK海力士以57%的营收份额位居第一,美光以21%排第二,三星以17%排第三。SK海力士的先发优势来自三次关键决策。第一次是时间上的抢先。2019年海力士率先量产HBM2E,2021年又成为全球首家开发出HBM3的厂商,并在此后很长一段时间内是唯一能大规模量产的供应商。英伟达A100和H100需求爆发时,海力士吃下了绝大部分高利润订单。第二次是封装技术的切换。三星一直使用传统的热压非导电薄膜技术做堆叠封装,这种工艺在层数增加时芯片容易因受热不均而翘曲,散热也会变差。SK海力士在HBM2E阶段果断引入了批量回流模塑底部填充技术,散热凸点数量是传统工艺的三倍,导热率明显更高。该技术同时规避了高温环境下的翘曲问题,良率大幅领先。第三次是供应链的锁定。海力士与日本主要供应商签订了环氧树脂模塑化合物的独家供货合同,这种材料能实现更均匀的间隙填充,三星和美光拿不到同等级的填充料。这三项决策的叠加结果是,当英伟达的HBM3E需求在2024至2025年集中释放时,SK海力士是唯一能稳定大规模供货的厂商。2025财年,海力士的年度营业利润达到47.21万亿韩元,同比增长101%,在利润规模上首次超过了三星电子。不得不说,公司有非常牛皮的人物!海力士HBM3的带宽、容量、功耗图:





三星在HBM上的被动源于早期的战略犹豫。2022年及之前,三星管理层认为HBM市场规模小、定制化成本高,将核心资源倾斜给了利润盘更大的传统移动端DRAM和大容量服务器DRAM。等到三星意识到HBM需求暴发时,SK海力士已经在HBM2E和HBM3两个代际建立了牢固的客户关系和技术壁垒。海力士在HBM上保持领先的核心壁垒图:





2023年算力全面短缺期间,三星利用其全球第一的DRAM总产能承接了大量非英伟达订单和上一代芯片需求,出货量一度追平了海力士。两家公司在2023年的HBM份额各自约为47.5%。但进入2024年,当市场重心向HBM3E转移时,三星的传统封装技术遭遇了严重瓶颈。其8层堆叠以上的HBM3E产品多次未能通过英伟达的严格验证,直到2025年9月,三星的12层HBM3E才最终通过认证,错过了英伟达Blackwell架构放量的黄金周期。美光走了另一条路。美光直接跳过了HBM3世代,用1-beta制程全力押注HBM3E。凭借优异的低功耗表现,美光在12层HBM3E上成功通过英伟达验证并成为第二大供应商。2025年三季度,美光迅速抢占全球21%的HBM份额,这部分份额多数是从三星手中夺走的。五、HBM4改用逻辑工艺



2026年是HBM4进入大规模出货的第一年。市场核心驱动力来自英伟达的Vera Rubin架构GPU。HBM4与上一代最明显的区别在于底部芯片的工艺发生了变化。HBM3E及更早的世代,底部芯片用的是和存储层相同的DRAM工艺,作用仅限于电源分配和信号缓冲。到了HBM4,底部芯片改用了逻辑芯片制造工艺,属于制造CPU或GPU时才用到的高精度制程。SK海力士和美光选择交由台积电代工,使用12纳米或3纳米节点,三星则用自有的4纳米工艺内部制造。换成逻辑工艺之后,底部芯片就能集成更复杂的控制电路,也可以按不同客户的需求定制功能。这样一来,HBM不再是一颗标准规格的存储器件,而变成了一个能够深度适配特定计算平台的系统级组件。这个变化也改变了存储厂和逻辑代工厂的关系。SK海力士与台积电于2024年4月签署谅解备忘录,双方共同开发HBM4,海力士将基础芯片外包给台积电制造。三星则选择用自身的4纳米工艺内部制造基板芯片,利用其同时拥有存储和代工业务的垂直整合能力。



三星在HBM4的时间点上抢先了一步。2026年2月,三星官方宣布全球首批大规模量产HBM4,速率达到11.7Gbps,超过了JEDEC官方标准的8Gbps。但三星面临的核心问题是前端工艺的良率。据韩媒报道,三星基于1c纳米DRAM的HBM4良率目前约在50%。SK海力士则采用更成熟的1b纳米工艺来生产HBM4,以良率优势换取稳定供应。如果三星无法将1c工艺良率在较短时间内提升至90%以上,15万片月产能的规划就难以兑现。





美光也没落后。2026年2月财报会议中管理层亲自澄清了“掉队”传闻,确认HBM4已进入大批量生产,比原计划提前一个季度。产品速率同样稳定在11Gbps以上。六、数百亿美元的扩产竞赛



三家存储厂的资本支出正在急剧上升。TrendForce数据显示,全球DRAM产能中专用于HBM的硅通孔封装产能占比从2025年底的约19%将增至2026年底的约23%。



SK海力士2026年新增晶圆产能主要集中在清州M15X工厂。该工厂投产时间比原计划提前了4个月,2026年2月开始大规模注片,初期月产能约1万片,计划在年内爬到平均每月8万片。在韩国龙仁半导体超级集群于2028年投产之前,M15X是海力士提升HBM产量的唯一保障。龙仁工厂由于地方审批和基础设施原因,实际投产可能推迟到2028年之后。为了填满这条产线,海力士在2026年3月向阿斯麦采购了价值约80亿美元的近30台低数值孔径EUV光刻机,计划在两年内分批交付。



三星在2026年的扩产步伐更大。韩媒ETNews报道,三星计划2026年HBM月产能从2025年底的约17万片增至约25万片,增幅接近50%。扩产手段包括将现有的传统DRAM产线转向HBM,以及在平泽P4工厂新建产线。此前停工两年的平泽P5工厂无尘室建设已恢复,P5厂房设计为三层建筑,洁净室数量比P4工厂的四个多了两个,达到六个,业内预计整体产能将结构性增长超过50%。



美光2026财年资本支出预计将增至250亿美元,明显高于此前市场预期的200亿至220亿美元。2027财年可能达到300亿美元以上。资金主要用于爱达荷州和纽约州的新工厂建设,以及日本广岛厂的EUV设备导入。美光管理层表示,2027财年的建设支出将比2026财年的60至80亿美元再增加100多亿美元。七、一些建议



涨价能持续多久,取决于供需缺口什么时候缩小。从目前的产能建设节奏看,三星清州M15X工厂和龙仁超级集群投产都在2028年之后。供给偏紧至少还会延续两年。咱们在景气周期里需要关注的是顺序。存储行业涨价最先受益的通常是模组和分销环节,这些公司手里的库存在涨价周期里直接增值。其次是先进封装环节,HBM堆叠层数越多,封装占总成本的比例越高,良率壁垒也越高。设备和材料排在后面,受益于扩产周期和国产替代的双重驱动。注:内容来自网络,未经核实,不构成任何投资建议,请谨慎参考!如有侵权,请私信联系删除!欢迎各位老师点赞、评论、转发,谢谢!㊗️各位老师发大财、股市长虹!

作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。

合规声明:本站发布的所有文章及观点均系个人研究共享,投资心得交流,不代表本站立场,且不构成任何形式的投资建议。投资者据此操作,风险自担,请务必保持独立审慎的决策态度。