减少6倍存储需求！Google一出手，美光闪迪集体蒸发

2026-03-26 10:16:296℃

点击上方蓝字关注我～

一篇技术论文又能做什么？

对美光、闪迪、西部数据、希捷来说，是一夜之间市值集体承压。

3月25日，美股存储板块集体走低。消息面上，没有财报暴雷，没有行业利空——只有一篇来自Google Research的技术论文。

TurboQuant，一个全新的KV缓存压缩方法。Google声称，它能将大模型的缓存内存占用减少至少6倍，同时实现最高8倍的加速。而且，精度无损。

如果你熟悉大模型推理的成本结构，就会立刻意识到这件事的分量——内存，正是大模型推理最贵的瓶颈之一。当Google用算法“撬开”了这个瓶颈，资本市场的第一反应是：存储，你还那么缺吗？

过去两年支撑存储超级周期的“供不应求”叙事，正被悄悄改写。这篇文章，我们就来拆解：TurboQuant到底动了谁的奶酪？

一、市场下跌不是意外，TurboQuant直击的是“内存消耗”这个命门

要理解为什么一篇论文能引发板块震荡，先得搞清楚大模型推理时，存储硬件到底在扮演什么角色。

大模型生成文本的过程，不是每次只算当前词，而是需要记住前面所有的对话内容——这就是KV缓存的作用。它就像一块临时的“草稿纸”，上下文越长，这块“草稿纸”就越大。在长上下文、高并发的推理场景下，KV缓存对内存容量的消耗，甚至超过了模型本身。

Google Research此次推出的TurboQuant，正是冲着这块“草稿纸”来的。根据科技媒体Tom's Hardware 2026年3月24日报道，该技术可将KV缓存压缩至3比特，内存占用减少至少6倍；在4比特模式下，在NVIDIA H100 GPU上，注意力计算速度最高可提升8倍。

更关键的是，这不是实验室里的“纸上谈兵”。

该技术已经在Gemma和Mistral等开源模型上通过了LongBench、Needle In A Haystack等权威基准测试，实现了精度无损。这意味着，它已经具备了产业化的基础。

资本市场嗅觉向来敏锐。当一种算法优化能够大幅削减对硬件的依赖，市场自然会重新评估硬件需求的增长曲线。TurboQuant指向的，恰恰是存储硬件在AI推理中最核心的应用场景。

二、基本面依然强劲，但问题出在“预期”二字上

当然，有人会立刻反驳：美光刚交出一份炸裂的财报，你怎么看？

2026财年第二季度，美光单季度营收238.6亿美元，同比增长196.4%；毛利率飙升至74.9%。据证券时报2026年3月下旬报道，公司预计下一季度营收中值335.7亿美元，毛利率进一步升至81%。这不是一家困境反转的企业，这是一台印钞机。

希捷、西部数据同样交出了亮眼的成绩单。据证券时报2026年2月9日援引TrendForce数据，2026年存储器产值将达5516亿美元，是晶圆代工的2.5倍以上。另据华南永昌证券2026年3月25日转载野村证券报告，AI驱动的存储长期牛市远未结束，供应缺口至少持续到2028年初。

那么问题来了：基本面这么好，为什么市场还会跌？

答案很简单：资本市场定价的从来不是“当下”，而是“未来预期”。

TurboQuant之所以能引发板块集体下跌，恰恰是因为它触碰了那个最敏感的神经——在算法持续优化的趋势下，未来对存储的需求，还能维持现在的高速增长吗？

过去两年存储板块的超级周期逻辑是：AI训练和推理对内存的消耗呈指数级增长，供给端产能扩张慢，导致供需缺口持续扩大，价格不断上涨。这个逻辑成立的前提是，需求增长的速度持续跑赢供给。

但如果算法优化能让同样的硬件做更多的事，需求的增长曲线就会变得平缓。这才是市场真正担心的。

3、冲击并非均匀分布，DRAM的压力远大于NAND

拆开来看，TurboQuant的影响并非“一视同仁”。

首当其冲的是DRAM。 TurboQuant直接作用于推理环节的“内存”消耗——KV缓存是存放在DRAM里的。如果这块需求被大幅压缩，DRAM的整体需求必然下降。

据野村证券预测，2026年第二季度DRAM价格环比涨幅将达51%，NAND涨幅为50%，两者看似接近，但背后的驱动力正在分化。DRAM的价格支撑主要来自HBM和训练集群，而NAND的价格支撑则更多来自海量数据存储、RAG架构和企业级SSD需求。

这里有一个关键区别：TurboQuant削减的是推理阶段的内存消耗，但无法替代HBM在训练阶段的高带宽需求，也无法替代SSD存储海量数据的需求。

换句话说，对NAND/SSD领域的冲击，远小于对DRAM领域。

但即便如此，DRAM领域也并非全面承压。高端市场——尤其是HBM——依然有稳固的基本面支撑。据证券时报2026年3月报道，美光为Vera Rubin平台设计的HBM4 36GB 12H产品已量产出货，HBM4E研发顺利。这类最高端的存储产品，服务于训练和顶级推理场景，TurboQuant无法取代。

真正的压力落在中低端DRAM市场——那些用于普通推理、边缘端部署的内存需求。当同样的推理任务只需要1/6的内存，整体内存采购量必然下降。

四、算法优化不是孤例，存储的“供给稀缺性”正在被持续削弱

TurboQuant不是孤例。

过去一年，我们看到一系列从算法层降低硬件依赖的技术突破：

模型量化技术不断演进，从8比特到4比特，现在Google做到了3比特。

专家混合模型（MoE）的普及，让推理时只激活部分参数，大幅降低计算和内存需求。

投机性解码等技术，显著提升了推理吞吐量。

这些技术的共同点是：都在用“软件创新”来弥补“硬件瓶颈”。当AI产业的降本增效从单纯依赖摩尔定律，转向软硬协同优化，存储硬件的“供给稀缺性”正在被持续削弱。

市场对存储板块的定价，过去两年一直建立在“供不应求将持续多年”的叙事之上。TurboQuant的出现，让这个叙事的根基第一次出现了裂痕。

当然，这并不意味着存储行业会立刻掉头向下。真正的风险在于：当算法持续优化，需求端的增速开始放缓，而供给端产能逐步释放，供需缺口会在某个时间点收窄甚至逆转。一旦这个拐点被市场确认，存储板块的高估值和高预期将面临全面重估。

5、结语：短期冲击是信号，但拐点仍需观察

回到开头那个问题：TurboQuant的出现，是否意味着存储超级周期的叙事被改写？

短期看，这确实是一次有力的信号，让市场重新审视“供不应求”逻辑的可持续性。存储板块的逻辑，短期内受到减损。

但从长期看，存储行业的演进方向也在变化——从“容量”竞争转向“性能”和“能效比”竞争。掌握HBM、先进SSD等高端产品的头部厂商，依然拥有护城河。真正承压的，是那些依赖中低端DRAM、靠“量价齐升”逻辑支撑估值的公司。

TurboQuant给我们最大的启示，不是存储板块明天就要跌，而是AI产业正在进入一个新的阶段——算法优化不再是配角，而是直接参与改写硬件需求曲线的变量。

作为投资者，如果你还在用“训练集群扩建”的旧地图来导航未来的存储投资，可能需要重新校准坐标了。

毕竟，当Google这样的巨头都开始在算法上“省内存”了，市场的预期，怎么可能还停留在原地呢？

最后还是得提醒一下，任何一个大周期中间总会出现一些质疑和扰动因素，你认为这次谷歌的技术是干扰项，还是决定项？

欢迎有懂的大佬留言交流

最后，别忘了点击右下角“

”

赠人玫瑰，手留余香，投资路上一起成长！

风险提示：本文仅为个人笔记，以上内容仅供参考，不作为投资决策的依据，不构成任何建议，据此入市风险自担。

历史文章可以在公众号菜单栏目查看

作者声明：本文转载自第三方，旨在提供资讯参考，并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日，作者与文中提及的标的不存在持仓关系。

标签: 6G 证券风险提示

合规声明：本站发布的所有文章及观点均系个人研究共享，投资心得交流，不代表本站立场，且不构成任何形式的投资建议。投资者据此操作，风险自担，请务必保持独立审慎的决策态度。

本文链接：https://www.sanhuba.cn/post/ba-24-8317.html

上一篇龙芯中科切入算力芯片

下一篇储能锂电景气上行，业绩与估值有望双升

减少6倍存储需求！Google一出手，美光闪迪集体蒸发

6G相关

栏目分类

证券相关

风险提示相关

用户须知

减少6倍存储需求！Google一出手，美光闪迪集体蒸发

 6G相关

 栏目分类

 证券相关

 风险提示相关

用户须知

6G相关

栏目分类

证券相关

风险提示相关

用户须知