根据最新消息,DeepSeek 官方 API 已于 2026年4月22日 进行了重要更新。本次更新的核心内容,上下文窗口大幅扩展
API 的上下文窗口已升级至 1M (100万) tokens,与 DeepSeek 的客户端及网页版保持一致。这比之前的 128k tokens 有了巨大提升,能够处理更长的文本内容。
模型知识库已更新至 2025年5月。在不联网的情况下,模型可以准确回答关于 2025年4月 的新闻和信息。此次更新疑似为之前曝光的 DeepSeek V4 Lite 版本。当前模型不支持视觉输入,仅支持文本和语音处理,仍为非多模态模型。DeepSeek 创始人此前透露,新一代旗舰大模型 DeepSeek V4 将于4月下旬正式发布,此次 API 更新可能是发布前的准备。DeepSeek V4 最核心的突破在于其全栈适配国产算力,彻底摆脱了对海外硬件的依赖。
V4 模型从训练到推理,已完全从英伟达的 CUDA 生态迁移至华为昇腾 950PR 芯片及 CANN 计算架构。
经过深度优化,V4 在昇腾芯片上的推理性能表现亮眼。实测数据显示,其单卡推理性能达到英伟达特供版 H20 芯片的 2.87 倍,同时成本大幅降低。
这证明了国产“芯片+计算架构”的组合完全有能力支撑世界级大模型的运行,为中国 AI 产业实现算力自主可控树立了标杆,有效应对了“卡脖子”的风险。
V4 并未陷入“参数军备竞赛”,而是通过架构创新,用更低的成本实现了更强的能力。
采用万亿参数规模的混合专家(MoE)架构,但在推理时仅激活约 370 亿参数。这种“巨人大脑,麻雀能耗”的设计,使其计算量仅为传统稠密模型的三分之一,推理成本显著降低。
原生支持 100 万 Token 的上下文窗口,能够一次性处理整本小说、超大型代码库或复杂的技术手册,极大地拓展了模型的应用边界。
V4 首次实现了对文本、图像、视频的统一理解,打破了单一模态的局限,开启了通用 AI 的新范式。
DeepSeek V4 的发布,对全球 AI 产业链和商业生态产生了深远影响。
凭借架构创新和国产算力,V4 的推理成本仅为同等 GPT 服务的十分之一。这种极致的性价比对现有 AI 商业化模式构成了巨大冲击,有望加速 AI 技术在各行各业的普及。
作为具有全球影响力的开源模型,DeepSeek V4 主动适配国产芯片,为整个国产算力供应链提供了强有力的信用背书。这将引导更多开发者和企业将算力需求导向国产硬件,加速形成“芯片-架构-模型-应用”的自主生态闭环。
V4 在代码生成(如 SWE-bench)、数学推理等关键基准测试中取得了领先成绩,展现了与全球顶尖模型竞争的实力。它的出现,标志着中国 AI 从追赶者转变为并跑者甚至在某些领域成为领跑者,正在改写由美国科技巨头主导的全球 AI 格局。
浙文互联 (600986):目前市场公认的唯一股权关联方。公司通过持有杭州浙文鑫睿基金份额,间接持有 DeepSeek 约 3.33% 的权益。
拓维信息 (002261):核心整机伙伴。作为华为昇腾生态第一大整机合作伙伴,承接大量昇腾芯片订单,旗下“兆瀚”服务器与 DeepSeek 完成全流程适配。
高新发展 (000757):超节点硬件。旗下华鲲振宇是昇腾生态核心整机厂商,为 V4 提供 Atlas 950 超节点硬件底座。
云赛智联 (600602):算力运营。作为上海昇腾智算核心运营商,为 DeepSeek 提供算力托管与 IDC 服务,深度绑定上海政务场景。
华丰科技 (688629):高速连接。华为核心供应商,提供高速背板连接器,受益于昇腾超节点对高带宽互联的需求。
恒为科技 (603496):智算运维。与华为在异构智算运维方面深度合作,受益于算力集群规模扩大后的维护需求。
神州数码 (000034):服务器分销。作为昇腾服务器总经销商,市占率领先,拥有强大的政务 AI 渠道能力。
软通动力 (301236):全栈服务。作为昇腾钻石级合作伙伴,提供从硬件到软件的全栈国产化替代服务。
川润股份 (002272):液冷散热。提供全液冷散热方案,适配高功耗的大模型算力设备。
作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。