真正读懂DeepSeek V4:国产化训练从0到1里程碑,战略意义大于性能意义
💡重要意义:国产开源大模型在国产算力训练适配领域以及百万级上下文能力实现了里程碑式突破。
💡DeepSeek V4是国产算力在国产通用大模型在训练侧从0到1的尝试。此前国产大模型采用国产算力均用于推理侧,而DeepSeek本次从模型内核到训练架构、到推理全流程均有国产算力参与,属于从0到1的里程碑。因此,无论DeepSeek V4表现如何,战略意义均十分重要,对国产算力的训练适配前景才是关注的重点。
💡DeepSeek V4首次由华为昇腾芯片参与训练
👉国产算力适配:DeepSeek V4 Flash是首个公开说明训练侧使用国产算力的通用大模型,通过引入三大核心设计初步实现国产算力底座的技术布局:
(1)MXFP4量化感知训练,降低对英伟达成熟FP8生态绑定,可适配国产算力;
(2)TileLang算子:可无缝编译中外硬件架构,同时适配英伟达以及国产算力卡,降低对CUDA依赖;
(3)自研MegaMoE2融合内核,已在华为昇腾平台跑通。
💡建议关注:国产算力训推大模型以及国产算力崛起相关标的
📈国产AI芯片及设施:寒武纪-U、海光信息、中科曙光;
📈国产GPU新锐厂商:摩尔线程-U、沐曦股份-U、品高股份;
📈CPU核心:禾盛新材;
📈算力硬件上游核心供应链:华丰科技、航天电器;
📈国产算力全流程训推大模型标的:科大讯飞。
📰以上数据均来自DeepSeek V4官方技术文档、DeepSeek官网、华为昇腾官网、Reuters公开信息。
❗️风险提示:大模型迭代节奏不及预期;国产算力软硬件生态适配进度不及预期;大模型行业市场竞争持续加剧;行业政策监管持续趋严
欢迎沟通!【东吴计算机】王紫敬/郑泽凡
作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。