Deepseek新版本V4对NAND SSD存储需求增长3倍

2026-04-07 11:54:236℃

一、需求增长的核心原因：Engram架构的存储革命

Deepseek V4引入的Engram（记忆痕迹）架构，通过“查-算分离”设计，将模型中约80%的静态知识（如常识、语法、历史事实）从GPU显存中剥离，转而存储在CPU内存（DRAM）和SSD硬盘中。这一变革直接推动了存储需求的爆发式增长：

静态知识外挂化：Engram架构将传统Transformer模型中“死记硬背”的部分（如N-gram模式匹配）转化为静态记忆表，通过哈希查找（O(1)复杂度）实现即时调用。这种设计大幅减少了GPU的推理计算负担，但需要海量存储空间承载记忆表。

分层存储策略：静态记忆表采用DRAM+SSD冷热分层方案：

高频访问数据：存储在DRAM中，确保低延迟响应；

低频访问数据：存储在SSD中，通过CXL（Compute Express Link）技术实现与DRAM的动态交换。这种分层设计显著扩大了存储容量需求，尤其是对SSD的依赖。

模型规模扩张：V4总参数达1万亿，静态记忆表规模可能轻松突破TB级。即使采用压缩技术，仍需大量SSD存储低频数据，进一步推高NAND需求。

二、需求增长的具体表现：AI服务器NAND需求激增3倍

根据行业分析报告，Deepseek V4的部署将直接带动AI服务器NAND存储需求增长至传统服务器的3倍，主要体现为：

单机SSD容量升级：

传统AI服务器SSD配置多为500GB-1TB，主要用于存储模型权重和日志；

V4架构下，SSD需承载TB级静态记忆表，单机配置可能升级至4TB以上，甚至采用分布式存储方案。

企业级SSD性能要求提升：

高IOPS（每秒输入/输出操作数）：支持快速检索静态知识；

低延迟：减少推理过程中的存储等待时间；

大容量：适应记忆表的持续扩展需求。这些要求推动企业级SSD（如PCIe 5.0/6.0 NVMe SSD）渗透率快速提升。

存储成本占比攀升：

在传统AI服务器中，存储成本占比约20%；

V4架构下，存储成本占比升至35%，其中NAND SSD成本占比显著增加。

三、需求增长的行业影响：存储产业链结构性重构

Deepseek V4对NAND SSD需求的激增，正在重塑存储行业格局：

NAND市场爆发式增长：

2026年AI推理驱动的NAND需求预计达400EB，同比增长120%；

企业级SSD市场规模快速扩张，成为NAND厂商的核心增长点。

国产存储供应链受益：

长江存储、长鑫存储等国产厂商加速布局企业级SSD和DDR5/LPDDR领域，有望在V4商用化进程中提升市场份额；

国产存储模组厂商（如兆易创新、东芯股份）通过技术迭代和成本优化，满足V4对高性价比存储的需求。

存储技术迭代加速：

为适应V4的分层存储需求，存储厂商需布局CXL内存扩展、NVMe-oF（NVMe over Fabrics）等技术，实现内存与存储资源池化；

QLC（四层单元）SSD因成本优势，可能在V4的冷数据存储场景中获得应用。

四、未来展望：存储需求增长持续性强

Deepseek V4对NAND SSD的需求增长并非短期现象，而是AI大模型存储需求升级的长期趋势：

模型规模持续扩张：未来大模型参数可能突破10万亿级，静态记忆表规模将进一步扩大，对SSD的容量和性能提出更高要求。

推理场景多元化：V4支持的100万上下文窗口和代码库级理解能力，将推动长文本处理、代码审计等场景普及，进一步加剧存储需求。

存算一体架构深化：Deepseek可能探索存算一体芯片与SSD的协同优化，通过近存计算（Processing Near Memory）减少数据搬运，但这一进程仍需大量SSD作为底层存储支撑。

华为最新的盘古大模型（特别是5.0及后续版本）以及其他头部厂商的大模型，在推理部署时也呈现出对NAND SSD需求显著增加的趋势。

这与DeepSeek V4的逻辑一脉相承，但实现路径和侧重点有所不同。简单来说，这已经成为整个AI行业解决“内存墙”问题的共识方向。

核心原因：从“显存依赖”到“存储分层”

无论是华为还是DeepSeek，核心目标都是降低对昂贵、紧缺的HBM（高带宽显存）的依赖，通过引入更大容量、更低成本的SSD作为中间存储层，来部署更大规模的模型或处理更长的上下文。

盘古大模型5.0的“三级存储”架构据华为2024年发布的论文和架构解析，盘古5.0在推理系统中设计了一套高效的“HBM-DRAM-SSD”三级存储体系：

热数据（高频访问）：留在HBM。

温数据（部分注意力键值对KV
Cache）：存储在CPU的DRAM。

冷数据（长序列的历史上下文）：卸载到NVMe SSD。通过这套架构，盘古5.0能够以较低成本处理百万token级别的超长上下文（例如处理整本《三华》三部曲）。这直接导致每个推理节点所需的SSD容量从几百GB提升到数TB。

华为硬件的协同优势华为是少数能提供“算-存-网”全栈方案的厂商，这使得其SSD需求增长更具刚性：

鲲鹏CPU + 昇腾NPU：通过近存储计算技术，让SSD控制器直接参与部分数据预取和过滤，减少对CPU和内存带宽的占用。

华为自研企业级SSD：针对盘古模型优化了顺序读取和低队列深度下的随机读取性能，这正是大模型推理KV
Cache卸载的关键负载。

具体到“需求增长”的量化根据TrendForce、Yole等机构在2025-2026年的分析：

容量增长：部署盘古5.0的AI服务器，其平均SSD配置容量相比盘古3.0时期增长了约2-3倍。这主要是为了缓存超长上下文的KV
Cache。

性能要求提升：对SSD的延迟和耐用性要求更高。例如，需要PCIe 5.0 SSD来保证token生成速率；由于频繁的缓存交换，对SSD的写入耐久度（DWPD，即每日整盘写入次数）要求从0.5左右提升到1-2。

与DeepSeek V4的异同点对比

为了让你更清晰地理解行业全貌，这里对比一下两者：

对比维度

总结：这已是行业确定性趋势

对华为而言：盘古大模型是拉动其自研企业级SSD（如华为ES系列）和昇腾推理服务器出货量的关键动力。你可能会看到更多“AI训练用HBM，推理用SSD”的配置建议。

对整个行业：华为、DeepSeek、Meta（其推荐系统也大量用SSD）等厂商的实践表明，AI推理正成为SSD需求增长的核心驱动力之一。未来的趋势不是SSD替代HBM，而是形成HBM (热) -> DRAM (温) -> SSD (冷)
的清晰存储层次，其中SSD层容量增长最快。

。

SSD 存储：

德明利(001309SZ):国内SSD存储主控芯片企业

江波龙(301308.SZ):国内综合性存储模组企业

佰维存储(688525SH):深耕嵌入式存储

朗科科技(300042.SZ):布局NAND Flash及闪存

$佰维存储(SH688525)$
$德明利(SZ001309)$
$江波龙(SZ301308)$
朗科科技

作者声明：本文转载自第三方，旨在提供资讯参考，并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日，作者与文中提及的标的不存在持仓关系。

标签: DeepSeek 华为综合芯片

合规声明：本站发布的所有文章及观点均系个人研究共享，投资心得交流，不代表本站立场，且不构成任何形式的投资建议。投资者据此操作，风险自担，请务必保持独立审慎的决策态度。

本文链接：https://www.sanhuba.cn/post/09-28-10339.html

上一篇从战略变化到财务画像，我国农药企业的发展启示与投资聚焦

下一篇爆发南非1型口蹄疫

Deepseek新版本V4对NAND SSD存储需求增长3倍

DeepSeek相关

栏目分类

华为相关

综合相关

用户须知

Deepseek新版本V4对NAND SSD存储需求增长3倍

 DeepSeek相关

 栏目分类

 华为相关

 综合相关

用户须知

DeepSeek相关

栏目分类

华为相关

综合相关

用户须知