【谷歌推出压缩算法TurboQuant 宣称实现约6倍内存节省 美股存储爆跌

2026-03-26 21:50:324
【谷歌推出压缩算法TurboQuant 宣称实现约6倍内存节省】财联社3月26日电,谷歌近日推出了一种可能降低人工智能系统内存需求的压缩算法TurboQuant。根据谷歌介绍,TurboQuant压缩技术旨在降低大语言模型和向量搜索引擎的内存占用。该算法主要针对AI系统中用于存储高频访问信息的键值缓存(key-value cache)瓶颈问题。随着上下文窗口变大,这些缓存正成为主要的内存瓶颈。TurboQuant可在无需重新训练或微调模型的情况下,将键值缓存压缩至3bit精度,同时基本保持模型准确率不受影响。对包括Gemma、Mistral等开源模型的测试显示,该技术可实现约6倍的键值缓存内存压缩效果。此外,在英伟达H100加速器上的测试结果显示,与未量化的键向量相比,该算法最高可实现约8倍性能提升。研究人员也表示,这项技术的应用不局限于AI模型,还包括支撑大规模搜索引擎的向量检索能力。谷歌计划于4月的国际学习表征会议(ICLR 2026)上展示TurboQuant技术。


短期(1–3 个月):AI 内存需求预期被砍半,存储股大跌、价格涨不动甚至回调。

中期(3–12 个月):单台服务器能跑更多模型、更多用户,内存采购量减少,价格难再暴涨。

长期(1–3 年):AI 变便宜、普及更快,总需求反而更大,但 “靠堆内存涨价” 的逻辑被打破

直接砍需求:以前要 6 台,现在 1 台就够跑同样的大模型、同样的用户量,内存用量直接降到原来的 1/6。以前 AI 公司抢着买高带宽内存(HBM)、大容量显存,现在买 1/6 就够。结果:需求预期暴跌 → 存储厂商不敢涨价、甚至降价抢单 → 价格高潮熄火。

TurboQuant 不是让存储消失,而是让 “靠堆内存赚暴利” 的时代结束,AI 从 “拼硬件” 转向 “拼算法效率”,存储价格短期降温、长期更稳但更卷。

【美股芯片存储板块盘前普跌闪迪跌近4%】财联社3月26日电,美股芯片存储板块盘前普跌。闪迪跌近4%,美光科技、西部数据跌近3%,希捷科技跌超2%。消息面上,谷歌推出压缩算法TurboQuant,宣称实现约6倍内存节省。


品高股份688227】公司与深圳江原科技有限公司在KV Cache多级缓存优化、SR-1OVGPU虚拟化驱动 KV Cache 多级缓存优化 + 软硬件融合,直接目标就是节约存储、降低存储带宽压力,属于 AI 大模型最典型的存储成本优化技术。KV Cache 多级缓存 + 软硬件融合做的是 降低了存储使用率


直接用通俗、好懂、能落地的方式,给你讲清楚 KV Cache 多级缓存优化 到底是什么、怎么做、有什么用。一句话核心把 KV Cache 按重要程度 + 访问频率分成好几级,高频重要的放快缓存(GPU 显存),低频不重要的放慢缓存(内存 / 硬盘)


飞利信300287】:是国内唯一拥有MLA掌握了类似MLA的基于缓存压缩的计算加速技术,MLA技术是在MHA推理计算中的一种KV缓存优化方法。 通过压缩KV缓存,直接大幅降低显存占用,也就是节约存储,显存占用能降到原来的几分之一甚至十几分之一 ,这就是实实在在的存储节约。



MLA通过压缩KV缓存,直接大幅降低显存占用,也就是节约存储。







美股异动|谷歌新技术有望解决内存瓶颈问题,存储概念股应声下跌


格隆汇3月25日|存储概念股全线下跌,闪迪跌5.2%,美光科技、希捷科技跌4.5%,西部数据跌3.6%

财联社3月26日【美股芯片存储板块盘前普跌闪迪跌近4%】财联社3月26日电,美股芯片存储板块盘前普跌。闪迪跌近4%,美光科技、西部数据跌近3%,希捷科技跌超2%。消息面上,谷歌推出压缩算法TurboQuant,宣称实现约6倍内存节省。

作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。

合规声明:本站发布的所有文章及观点均系个人研究共享,投资心得交流,不代表本站立场,且不构成任何形式的投资建议。投资者据此操作,风险自担,请务必保持独立审慎的决策态度。