Deepseek新版本V4对NAND SSD存储需求增长3倍
一、需求增长的核心原因:Engram架构的存储革命Deepseek V4引入的Engram(记忆痕迹)架构,通过“查-算分离”设计,将模型中约80%的静态知识(如常识、语法、历史事实)从GPU显存中剥离,转而存储在CPU内存(DRAM)和SSD硬盘中。这一变革直接推动了存储需求的爆发式增长:
静态知识外挂化:Engram架构将传统Transformer模型中“死记硬背”的部分(如N-gram模式匹配)转化为静态记忆表,通过哈希查找(O(1)复杂度)实现即时调用。这种设计大幅减少了GPU的推理计算负担,但需要海量存储空间承载记忆表。
分层存储策略:静态记忆表采用DRAM+SSD冷热分层方案:
高频访问数据:存储在DRAM中,确保低延迟响应;
低频访问数据:存储在SSD中,通过CXL(Compute Express Link)技术实现与DRAM的动态交换。这种分层设计显著扩大了存储容量需求,尤其是对SSD的依赖。
模型规模扩张:V4总参数达1万亿,静态记忆表规模可能轻松突破TB级。即使采用压缩技术,仍需大量SSD存储低频数据,进一步推高NAND需求。
二、需求增长的具体表现:AI服务器NAND需求激增3倍根据行业分析报告,Deepseek V4的部署将直接带动AI服务器NAND存储需求增长至传统服务器的3倍,主要体现为:
单机SSD容量升级:
传统AI服务器SSD配置多为500GB-1TB,主要用于存储模型权重和日志;
V4架构下,SSD需承载TB级静态记忆表,单机配置可能升级至4TB以上,甚至采用分布式存储方案。
企业级SSD性能要求提升:
高IOPS(每秒输入/输出操作数):支持快速检索静态知识;
低延迟:减少推理过程中的存储等待时间;
大容量:适应记忆表的持续扩展需求。这些要求推动企业级SSD(如PCIe 5.0/6.0 NVMe SSD)渗透率快速提升。
存储成本占比攀升:
在传统AI服务器中,存储成本占比约20%;
V4架构下,存储成本占比升至35%,其中NAND SSD成本占比显著增加。
三、需求增长的行业影响:存储产业链结构性重构Deepseek V4对NAND SSD需求的激增,正在重塑存储行业格局:
NAND市场爆发式增长:
2026年AI推理驱动的NAND需求预计达400EB,同比增长120%;
企业级SSD市场规模快速扩张,成为NAND厂商的核心增长点。
国产存储供应链受益:
长江存储、长鑫存储等国产厂商加速布局企业级SSD和DDR5/LPDDR领域,有望在V4商用化进程中提升市场份额;
国产存储模组厂商(如兆易创新、东芯股份)通过技术迭代和成本优化,满足V4对高性价比存储的需求。
存储技术迭代加速:
为适应V4的分层存储需求,存储厂商需布局CXL内存扩展、NVMe-oF(NVMe over Fabrics)等技术,实现内存与存储资源池化;
QLC(四层单元)SSD因成本优势,可能在V4的冷数据存储场景中获得应用。
四、未来展望:存储需求增长持续性强Deepseek V4对NAND SSD的需求增长并非短期现象,而是AI大模型存储需求升级的长期趋势:
模型规模持续扩张:未来大模型参数可能突破10万亿级,静态记忆表规模将进一步扩大,对SSD的容量和性能提出更高要求。
推理场景多元化:V4支持的100万上下文窗口和代码库级理解能力,将推动长文本处理、代码审计等场景普及,进一步加剧存储需求。
存算一体架构深化:Deepseek可能探索存算一体芯片与SSD的协同优化,通过近存计算(Processing Near Memory)减少数据搬运,但这一进程仍需大量SSD作为底层存储支撑。
华为最新的盘古大模型(特别是5.0及后续版本)以及其他头部厂商的大模型,在推理部署时也呈现出对NAND SSD需求显著增加的趋势。
这与DeepSeek V4的逻辑一脉相承,但实现路径和侧重点有所不同。简单来说,这已经成为整个AI行业解决“内存墙”问题的共识方向。
核心原因:从“显存依赖”到“存储分层”无论是华为还是DeepSeek,核心目标都是降低对昂贵、紧缺的HBM(高带宽显存)的依赖,通过引入更大容量、更低成本的SSD作为中间存储层,来部署更大规模的模型或处理更长的上下文。
盘古大模型5.0的“三级存储”架构据华为2024年发布的论文和架构解析,盘古5.0在推理系统中设计了一套高效的“HBM-DRAM-SSD”三级存储体系:
热数据(高频访问):留在HBM。
温数据(部分注意力键值对KV
Cache):存储在CPU的DRAM。
冷数据(长序列的历史上下文):卸载到NVMe SSD。通过这套架构,盘古5.0能够以较低成本处理百万token级别的超长上下文(例如处理整本《三华》三部曲)。这直接导致每个推理节点所需的SSD容量从几百GB提升到数TB。
华为硬件的协同优势华为是少数能提供“算-存-网”全栈方案的厂商,这使得其SSD需求增长更具刚性:
鲲鹏CPU + 昇腾NPU:通过近存储计算技术,让SSD控制器直接参与部分数据预取和过滤,减少对CPU和内存带宽的占用。
华为自研企业级SSD:针对盘古模型优化了顺序读取和低队列深度下的随机读取性能,这正是大模型推理KV
Cache卸载的关键负载。
具体到“需求增长”的量化根据TrendForce、Yole等机构在2025-2026年的分析:
容量增长:部署盘古5.0的AI服务器,其平均SSD配置容量相比盘古3.0时期增长了约2-3倍。这主要是为了缓存超长上下文的KV
Cache。
性能要求提升:对SSD的延迟和耐用性要求更高。例如,需要PCIe 5.0 SSD来保证token生成速率;由于频繁的缓存交换,对SSD的写入耐久度(DWPD,即每日整盘写入次数)要求从0.5左右提升到1-2。
与DeepSeek V4的异同点对比为了让你更清晰地理解行业全貌,这里对比一下两者:
对比维度

总结:这已是行业确定性趋势
对华为而言:盘古大模型是拉动其自研企业级SSD(如华为ES系列)和昇腾推理服务器出货量的关键动力。你可能会看到更多“AI训练用HBM,推理用SSD”的配置建议。
对整个行业:华为、DeepSeek、Meta(其推荐系统也大量用SSD)等厂商的实践表明,AI推理正成为SSD需求增长的核心驱动力之一。未来的趋势不是SSD替代HBM,而是形成HBM (热) -> DRAM (温) -> SSD (冷)
的清晰存储层次,其中SSD层容量增长最快。
。
SSD 存储:
德明利(001309SZ):国内SSD存储主控芯片企业
江波龙(301308.SZ):国内综合性存储模组企业
佰维存储(688525SH):深耕嵌入式存储
朗科科技(300042.SZ):布局NAND Flash及闪存
$佰维存储(SH688525)$
$德明利(SZ001309)$
$江波龙(SZ301308)$
朗科科技
作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。