点击上方蓝字关注我~
一篇技术论文又能做什么?
对美光、闪迪、西部数据、希捷来说,是一夜之间市值集体承压。
3月25日,美股存储板块集体走低。消息面上,没有财报暴雷,没有行业利空——只有一篇来自Google Research的技术论文。
TurboQuant,一个全新的KV缓存压缩方法。Google声称,它能将大模型的缓存内存占用减少至少6倍,同时实现最高8倍的加速。而且,精度无损。
如果你熟悉大模型推理的成本结构,就会立刻意识到这件事的分量——内存,正是大模型推理最贵的瓶颈之一。当Google用算法“撬开”了这个瓶颈,资本市场的第一反应是:存储,你还那么缺吗?
过去两年支撑存储超级周期的“供不应求”叙事,正被悄悄改写。这篇文章,我们就来拆解:TurboQuant到底动了谁的奶酪?
一、市场下跌不是意外,TurboQuant直击的是“内存消耗”这个命门要理解为什么一篇论文能引发板块震荡,先得搞清楚大模型推理时,存储硬件到底在扮演什么角色。
大模型生成文本的过程,不是每次只算当前词,而是需要记住前面所有的对话内容——这就是KV缓存的作用。它就像一块临时的“草稿纸”,上下文越长,这块“草稿纸”就越大。在长上下文、高并发的推理场景下,KV缓存对内存容量的消耗,甚至超过了模型本身。
Google Research此次推出的TurboQuant,正是冲着这块“草稿纸”来的。根据科技媒体Tom's Hardware 2026年3月24日报道,该技术可将KV缓存压缩至3比特,内存占用减少至少6倍;在4比特模式下,在NVIDIA H100 GPU上,注意力计算速度最高可提升8倍。
更关键的是,这不是实验室里的“纸上谈兵”。
该技术已经在Gemma和Mistral等开源模型上通过了LongBench、Needle In A Haystack等权威基准测试,实现了精度无损。这意味着,它已经具备了产业化的基础。
资本市场嗅觉向来敏锐。当一种算法优化能够大幅削减对硬件的依赖,市场自然会重新评估硬件需求的增长曲线。TurboQuant指向的,恰恰是存储硬件在AI推理中最核心的应用场景。
二、基本面依然强劲,但问题出在“预期”二字上当然,有人会立刻反驳:美光刚交出一份炸裂的财报,你怎么看?
2026财年第二季度,美光单季度营收238.6亿美元,同比增长196.4%;毛利率飙升至74.9%。 据证券时报2026年3月下旬报道,公司预计下一季度营收中值335.7亿美元,毛利率进一步升至81%。这不是一家困境反转的企业,这是一台印钞机。
希捷、西部数据同样交出了亮眼的成绩单。据证券时报2026年2月9日援引TrendForce数据,2026年存储器产值将达5516亿美元,是晶圆代工的2.5倍以上。另据华南永昌证券2026年3月25日转载野村证券报告,AI驱动的存储长期牛市远未结束,供应缺口至少持续到2028年初。
那么问题来了:基本面这么好,为什么市场还会跌?
答案很简单:资本市场定价的从来不是“当下”,而是“未来预期”。
TurboQuant之所以能引发板块集体下跌,恰恰是因为它触碰了那个最敏感的神经——在算法持续优化的趋势下,未来对存储的需求,还能维持现在的高速增长吗?
过去两年存储板块的超级周期逻辑是:AI训练和推理对内存的消耗呈指数级增长,供给端产能扩张慢,导致供需缺口持续扩大,价格不断上涨。这个逻辑成立的前提是,需求增长的速度持续跑赢供给。
但如果算法优化能让同样的硬件做更多的事,需求的增长曲线就会变得平缓。这才是市场真正担心的。
3、冲击并非均匀分布,DRAM的压力远大于NAND
拆开来看,TurboQuant的影响并非“一视同仁”。
首当其冲的是DRAM。 TurboQuant直接作用于推理环节的“内存”消耗——KV缓存是存放在DRAM里的。如果这块需求被大幅压缩,DRAM的整体需求必然下降。
据野村证券预测,2026年第二季度DRAM价格环比涨幅将达51%,NAND涨幅为50%,两者看似接近,但背后的驱动力正在分化。DRAM的价格支撑主要来自HBM和训练集群,而NAND的价格支撑则更多来自海量数据存储、RAG架构和企业级SSD需求。
这里有一个关键区别:TurboQuant削减的是推理阶段的内存消耗,但无法替代HBM在训练阶段的高带宽需求,也无法替代SSD存储海量数据的需求。
换句话说,对NAND/SSD领域的冲击,远小于对DRAM领域。
但即便如此,DRAM领域也并非全面承压。高端市场——尤其是HBM——依然有稳固的基本面支撑。据证券时报2026年3月报道,美光为Vera Rubin平台设计的HBM4 36GB 12H产品已量产出货,HBM4E研发顺利。这类最高端的存储产品,服务于训练和顶级推理场景,TurboQuant无法取代。
真正的压力落在中低端DRAM市场——那些用于普通推理、边缘端部署的内存需求。 当同样的推理任务只需要1/6的内存,整体内存采购量必然下降。
四、算法优化不是孤例,存储的“供给稀缺性”正在被持续削弱TurboQuant不是孤例。
过去一年,我们看到一系列从算法层降低硬件依赖的技术突破:
模型量化技术不断演进,从8比特到4比特,现在Google做到了3比特。
专家混合模型(MoE)的普及,让推理时只激活部分参数,大幅降低计算和内存需求。
投机性解码等技术,显著提升了推理吞吐量。
这些技术的共同点是:都在用“软件创新”来弥补“硬件瓶颈”。当AI产业的降本增效从单纯依赖摩尔定律,转向软硬协同优化,存储硬件的“供给稀缺性”正在被持续削弱。
市场对存储板块的定价,过去两年一直建立在“供不应求将持续多年”的叙事之上。TurboQuant的出现,让这个叙事的根基第一次出现了裂痕。
当然,这并不意味着存储行业会立刻掉头向下。真正的风险在于:当算法持续优化,需求端的增速开始放缓,而供给端产能逐步释放,供需缺口会在某个时间点收窄甚至逆转。 一旦这个拐点被市场确认,存储板块的高估值和高预期将面临全面重估。
5、结语:短期冲击是信号,但拐点仍需观察回到开头那个问题:TurboQuant的出现,是否意味着存储超级周期的叙事被改写?
短期看,这确实是一次有力的信号,让市场重新审视“供不应求”逻辑的可持续性。 存储板块的逻辑,短期内受到减损。
但从长期看,存储行业的演进方向也在变化——从“容量”竞争转向“性能”和“能效比”竞争。掌握HBM、先进SSD等高端产品的头部厂商,依然拥有护城河。真正承压的,是那些依赖中低端DRAM、靠“量价齐升”逻辑支撑估值的公司。
TurboQuant给我们最大的启示,不是存储板块明天就要跌,而是AI产业正在进入一个新的阶段——算法优化不再是配角,而是直接参与改写硬件需求曲线的变量。
作为投资者,如果你还在用“训练集群扩建”的旧地图来导航未来的存储投资,可能需要重新校准坐标了。
毕竟,当Google这样的巨头都开始在算法上“省内存”了,市场的预期,怎么可能还停留在原地呢?
最后还是得提醒一下,任何一个大周期中间总会出现一些质疑和扰动因素,你认为这次谷歌的技术是干扰项,还是决定项?
欢迎有懂的大佬留言交流
最后,别忘了点击右下角“
”
赠人玫瑰,手留余香,投资路上一起成长!
风险提示:本文仅为个人笔记,以上内容仅供参考,不作为投资决策的依据,不构成任何建议,据此入市风险自担。
历史文章可以在公众号菜单栏目查看
作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。