【谷歌推出压缩算法TurboQuant 宣称实现约6倍内存节省美股存储爆跌

2026-03-26 21:50:328℃

【谷歌推出压缩算法TurboQuant 宣称实现约6倍内存节省】财联社3月26日电，谷歌近日推出了一种可能降低人工智能系统内存需求的压缩算法TurboQuant。根据谷歌介绍，TurboQuant压缩技术旨在降低大语言模型和向量搜索引擎的内存占用。该算法主要针对AI系统中用于存储高频访问信息的键值缓存（key-value cache）瓶颈问题。随着上下文窗口变大，这些缓存正成为主要的内存瓶颈。TurboQuant可在无需重新训练或微调模型的情况下，将键值缓存压缩至3bit精度，同时基本保持模型准确率不受影响。对包括Gemma、Mistral等开源模型的测试显示，该技术可实现约6倍的键值缓存内存压缩效果。此外，在英伟达H100加速器上的测试结果显示，与未量化的键向量相比，该算法最高可实现约8倍性能提升。研究人员也表示，这项技术的应用不局限于AI模型，还包括支撑大规模搜索引擎的向量检索能力。谷歌计划于4月的国际学习表征会议（ICLR 2026）上展示TurboQuant技术。

短期（1–3 个月）：AI 内存需求预期被砍半，存储股大跌、价格涨不动甚至回调。

中期（3–12 个月）：单台服务器能跑更多模型、更多用户，内存采购量减少，价格难再暴涨。

长期（1–3 年）：AI 变便宜、普及更快，总需求反而更大，但 “靠堆内存涨价” 的逻辑被打破

直接砍需求：以前要 6 台，现在 1 台就够跑同样的大模型、同样的用户量，内存用量直接降到原来的 1/6。以前 AI 公司抢着买高带宽内存（HBM）、大容量显存，现在买 1/6 就够。结果：需求预期暴跌 → 存储厂商不敢涨价、甚至降价抢单 → 价格高潮熄火。

TurboQuant 不是让存储消失，而是让 “靠堆内存赚暴利” 的时代结束，AI 从 “拼硬件” 转向 “拼算法效率”，存储价格短期降温、长期更稳但更卷。

【美股芯片存储板块盘前普跌闪迪跌近4%】财联社3月26日电，美股芯片存储板块盘前普跌。闪迪跌近4%，美光科技、西部数据跌近3%，希捷科技跌超2%。消息面上，谷歌推出压缩算法TurboQuant，宣称实现约6倍内存节省。

【品高股份688227】公司与深圳江原科技有限公司在KV Cache多级缓存优化、SR-1OVGPU虚拟化驱动 KV Cache 多级缓存优化 + 软硬件融合，直接目标就是节约存储、降低存储带宽压力，属于 AI 大模型最典型的存储成本优化技术。KV Cache 多级缓存 + 软硬件融合做的是降低了存储使用率