减少6倍存储需求!Google一出手,美光闪迪集体蒸发

2026-03-26 10:16:293

点击上方蓝字关注我~

一篇技术论文又能做什么?

对美光、闪迪、西部数据、希捷来说,是一夜之间市值集体承压。

3月25日,美股存储板块集体走低。消息面上,没有财报暴雷,没有行业利空——只有一篇来自Google Research的技术论文。

TurboQuant,一个全新的KV缓存压缩方法。Google声称,它能将大模型的缓存内存占用减少至少6倍,同时实现最高8倍的加速。而且,精度无损。

如果你熟悉大模型推理的成本结构,就会立刻意识到这件事的分量——内存,正是大模型推理最贵的瓶颈之一。当Google用算法“撬开”了这个瓶颈,资本市场的第一反应是:存储,你还那么缺吗?

过去两年支撑存储超级周期的“供不应求”叙事,正被悄悄改写。这篇文章,我们就来拆解:TurboQuant到底动了谁的奶酪?

一、市场下跌不是意外,TurboQuant直击的是“内存消耗”这个命门

要理解为什么一篇论文能引发板块震荡,先得搞清楚大模型推理时,存储硬件到底在扮演什么角色。

大模型生成文本的过程,不是每次只算当前词,而是需要记住前面所有的对话内容——这就是KV缓存的作用。它就像一块临时的“草稿纸”,上下文越长,这块“草稿纸”就越大。在长上下文、高并发的推理场景下,KV缓存对内存容量的消耗,甚至超过了模型本身。

Google Research此次推出的TurboQuant,正是冲着这块“草稿纸”来的。根据科技媒体Tom's Hardware 2026年3月24日报道,该技术可将KV缓存压缩至3比特,内存占用减少至少6倍;在4比特模式下,在NVIDIA H100 GPU上,注意力计算速度最高可提升8倍。

更关键的是,这不是实验室里的“纸上谈兵”。

该技术已经在Gemma和Mistral等开源模型上通过了LongBench、Needle In A Haystack等权威基准测试,实现了精度无损。这意味着,它已经具备了产业化的基础。

资本市场嗅觉向来敏锐。当一种算法优化能够大幅削减对硬件的依赖,市场自然会重新评估硬件需求的增长曲线。TurboQuant指向的,恰恰是存储硬件在AI推理中最核心的应用场景。

二、基本面依然强劲,但问题出在“预期”二字上

当然,有人会立刻反驳:美光刚交出一份炸裂的财报,你怎么看?

2026财年第二季度,美光单季度营收238.6亿美元,同比增长196.4%;毛利率飙升至74.9%。 据证券时报2026年3月下旬报道,公司预计下一季度营收中值335.7亿美元,毛利率进一步升至81%。这不是一家困境反转的企业,这是一台印钞机。

希捷、西部数据同样交出了亮眼的成绩单。据证券时报2026年2月9日援引TrendForce数据,2026年存储器产值将达5516亿美元,是晶圆代工的2.5倍以上。另据华南永昌证券2026年3月25日转载野村证券报告,AI驱动的存储长期牛市远未结束,供应缺口至少持续到2028年初。

那么问题来了:基本面这么好,为什么市场还会跌?

答案很简单:资本市场定价的从来不是“当下”,而是“未来预期”。

TurboQuant之所以能引发板块集体下跌,恰恰是因为它触碰了那个最敏感的神经——在算法持续优化的趋势下,未来对存储的需求,还能维持现在的高速增长吗?

过去两年存储板块的超级周期逻辑是:AI训练和推理对内存的消耗呈指数级增长,供给端产能扩张慢,导致供需缺口持续扩大,价格不断上涨。这个逻辑成立的前提是,需求增长的速度持续跑赢供给。

但如果算法优化能让同样的硬件做更多的事,需求的增长曲线就会变得平缓。这才是市场真正担心的。

3、冲击并非均匀分布,DRAM的压力远大于NAND

拆开来看,TurboQuant的影响并非“一视同仁”。

首当其冲的是DRAM。 TurboQuant直接作用于推理环节的“内存”消耗——KV缓存是存放在DRAM里的。如果这块需求被大幅压缩,DRAM的整体需求必然下降。

据野村证券预测,2026年第二季度DRAM价格环比涨幅将达51%,NAND涨幅为50%,两者看似接近,但背后的驱动力正在分化。DRAM的价格支撑主要来自HBM和训练集群,而NAND的价格支撑则更多来自海量数据存储、RAG架构和企业级SSD需求。

这里有一个关键区别:TurboQuant削减的是推理阶段的内存消耗,但无法替代HBM在训练阶段的高带宽需求,也无法替代SSD存储海量数据的需求。

换句话说,对NAND/SSD领域的冲击,远小于对DRAM领域。

但即便如此,DRAM领域也并非全面承压。高端市场——尤其是HBM——依然有稳固的基本面支撑。据证券时报2026年3月报道,美光为Vera Rubin平台设计的HBM4 36GB 12H产品已量产出货,HBM4E研发顺利。这类最高端的存储产品,服务于训练和顶级推理场景,TurboQuant无法取代。

真正的压力落在中低端DRAM市场——那些用于普通推理、边缘端部署的内存需求。 当同样的推理任务只需要1/6的内存,整体内存采购量必然下降。

四、算法优化不是孤例,存储的“供给稀缺性”正在被持续削弱

TurboQuant不是孤例。

过去一年,我们看到一系列从算法层降低硬件依赖的技术突破:

模型量化技术不断演进,从8比特到4比特,现在Google做到了3比特。

专家混合模型(MoE)的普及,让推理时只激活部分参数,大幅降低计算和内存需求。

投机性解码等技术,显著提升了推理吞吐量。

这些技术的共同点是:都在用“软件创新”来弥补“硬件瓶颈”。当AI产业的降本增效从单纯依赖摩尔定律,转向软硬协同优化,存储硬件的“供给稀缺性”正在被持续削弱。

市场对存储板块的定价,过去两年一直建立在“供不应求将持续多年”的叙事之上。TurboQuant的出现,让这个叙事的根基第一次出现了裂痕。

当然,这并不意味着存储行业会立刻掉头向下。真正的风险在于:当算法持续优化,需求端的增速开始放缓,而供给端产能逐步释放,供需缺口会在某个时间点收窄甚至逆转。 一旦这个拐点被市场确认,存储板块的高估值和高预期将面临全面重估。

5、结语:短期冲击是信号,但拐点仍需观察

回到开头那个问题:TurboQuant的出现,是否意味着存储超级周期的叙事被改写?

短期看,这确实是一次有力的信号,让市场重新审视“供不应求”逻辑的可持续性。 存储板块的逻辑,短期内受到减损。

但从长期看,存储行业的演进方向也在变化——从“容量”竞争转向“性能”和“能效比”竞争。掌握HBM、先进SSD等高端产品的头部厂商,依然拥有护城河。真正承压的,是那些依赖中低端DRAM、靠“量价齐升”逻辑支撑估值的公司。

TurboQuant给我们最大的启示,不是存储板块明天就要跌,而是AI产业正在进入一个新的阶段——算法优化不再是配角,而是直接参与改写硬件需求曲线的变量。

作为投资者,如果你还在用“训练集群扩建”的旧地图来导航未来的存储投资,可能需要重新校准坐标了。

毕竟,当Google这样的巨头都开始在算法上“省内存”了,市场的预期,怎么可能还停留在原地呢?

最后还是得提醒一下,任何一个大周期中间总会出现一些质疑和扰动因素,你认为这次谷歌的技术是干扰项,还是决定项?

欢迎有懂的大佬留言交流

最后,别忘了点击右下角“

赠人玫瑰,手留余香,投资路上一起成长!

风险提示:本文仅为个人笔记,以上内容仅供参考,不作为投资决策的依据,不构成任何建议,据此入市风险自担。

历史文章可以在公众号菜单栏目查看

作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。

合规声明:本站发布的所有文章及观点均系个人研究共享,投资心得交流,不代表本站立场,且不构成任何形式的投资建议。投资者据此操作,风险自担,请务必保持独立审慎的决策态度。