
短期(1–3 个月):AI 内存需求预期被砍半,存储股大跌、价格涨不动甚至回调。
中期(3–12 个月):单台服务器能跑更多模型、更多用户,内存采购量减少,价格难再暴涨。
长期(1–3 年):AI 变便宜、普及更快,总需求反而更大,但 “靠堆内存涨价” 的逻辑被打破
直接砍需求:以前要 6 台,现在 1 台就够跑同样的大模型、同样的用户量,内存用量直接降到原来的 1/6。以前 AI 公司抢着买高带宽内存(HBM)、大容量显存,现在买 1/6 就够。结果:需求预期暴跌 → 存储厂商不敢涨价、甚至降价抢单 → 价格高潮熄火。
TurboQuant 不是让存储消失,而是让 “靠堆内存赚暴利” 的时代结束,AI 从 “拼硬件” 转向 “拼算法效率”,存储价格短期降温、长期更稳但更卷。
【美股芯片存储板块盘前普跌闪迪跌近4%】财联社3月26日电,美股芯片存储板块盘前普跌。闪迪跌近4%,美光科技、西部数据跌近3%,希捷科技跌超2%。消息面上,谷歌推出压缩算法TurboQuant,宣称实现约6倍内存节省。

【品高股份688227】公司与深圳江原科技有限公司在KV Cache多级缓存优化、SR-1OVGPU虚拟化驱动 KV Cache 多级缓存优化 + 软硬件融合,直接目标就是节约存储、降低存储带宽压力,属于 AI 大模型最典型的存储成本优化技术。KV Cache 多级缓存 + 软硬件融合做的是 降低了存储使用率

直接用通俗、好懂、能落地的方式,给你讲清楚 KV Cache 多级缓存优化 到底是什么、怎么做、有什么用。一句话核心把 KV Cache 按重要程度 + 访问频率分成好几级,高频重要的放快缓存(GPU 显存),低频不重要的放慢缓存(内存 / 硬盘)

【飞利信300287】:是国内唯一拥有MLA掌握了类似MLA的基于缓存压缩的计算加速技术,MLA技术是在MHA推理计算中的一种KV缓存优化方法。 通过压缩KV缓存,直接大幅降低显存占用,也就是节约存储,显存占用能降到原来的几分之一甚至十几分之一 ,这就是实实在在的存储节约。

MLA通过压缩KV缓存,直接大幅降低显存占用,也就是节约存储。

美股异动|谷歌新技术有望解决内存瓶颈问题,存储概念股应声下跌

格隆汇3月25日|存储概念股全线下跌,闪迪跌5.2%,美光科技、希捷科技跌4.5%,西部数据跌3.6%
财联社3月26日【美股芯片存储板块盘前普跌闪迪跌近4%】财联社3月26日电,美股芯片存储板块盘前普跌。闪迪跌近4%,美光科技、西部数据跌近3%,希捷科技跌超2%。消息面上,谷歌推出压缩算法TurboQuant,宣称实现约6倍内存节省。
作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。