DeepseekI v4

2026-03-12 11:11:372
杭钢股份已涨停。
从目前泄露的截图中可以看出,DeepSeek-V4-INT8 的模型文件已在进行同步。而随之流出的Technical Specs(技术规格表),则向业界展示了何谓"极致的性价比屠夫"。
【泄露版】DeepSeek V4 核心性能参数:
总参数量:~1 万亿(1 Trillion),正式跨入万亿俱乐部。
激活参数量:320 亿(32B)。(划重点:激活率仅 3%!)
上下文窗口:100 万(1M)Tokens,轻松吞吐长篇巨著与海量代码。
多模态能力:文本 + 视觉 + 原生音频(Audio)。
开源许可:MIT 协议(极致的商业友好与开放)。
深度解读:V4 展现出了对 MoE(混合专家)架构登峰造极的掌控力。总参数高达1万亿,意味着它拥有足以媲美 GPT-5.4 的知识储备和逻辑上限;但每次推理仅激活3%(32B),这意味着其运行成本被压缩到了极其恐怖的低位。把每一分算力都用在刀刃上,DeepSeek 再次捍卫了自己“算力刺客”的威名。
此外,原生音频的加入,标志着 V4 彻底补全了全模态拼图,剑指实时语音交互,与当下的国际顶流模型展开贴身肉搏。
02 | 底座揭秘:联手华为昇腾,推理成本暴降至英伟达1/3?
如果说算法是利刃,那算力就是握剑的手。此次泄露信息中最引人瞩目的,是规格表中明确标注的:“深度适配华为昇腾体系”。
据多位接近华为与 DeepSeek 供应链的业内人士透露,V4 并没有走“先出模型,后做芯片移植”的老路,而是完成了一次罕见的 “0day 原生协同优化”。
底层全栈打通:告别“事后修补”基于华为最新的 CANN 8.0 底层工具链,双方在研发早期就针对 FP8/INT8 低精度计算、100万 Token 超长上下文以及 V4 复杂的 MoE 架构进行了深度定制。这使得 V4 在昇腾芯片上实现了“原生直驱”,彻底摒弃了繁琐的指令翻译折损。
惊人的商业账本:实测数据的流出更是向市场投下了一枚深水炸弹。
推理侧(基于昇腾 910C/950PR):单卡速度较上一代主力 910B 提升约 30%,算力利用率稳居 85%以上。业内传闻,其整体推理成本已被压缩至英伟达同类方案的 1/3 左右。
训练侧(基于昇腾 950DT):面对万亿参数的 V4 Full 版本,双方疑似动用了最大可扩展至 8192 卡的 Atlas 950 SuperPoD 超节点集群。凭借 2TB/s 的芯片间互联带宽,轻松消化了 V4 多模态的高带宽需求。
这意味着,国产AI首次在“万亿模型+顶级集群”的配合上,实现了从训练到部署的完全自主受控与性价比超越。

作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。

合规声明:本站发布的所有文章及观点均系个人研究共享,投资心得交流,不代表本站立场,且不构成任何形式的投资建议。投资者据此操作,风险自担,请务必保持独立审慎的决策态度。