DeepSeek-V4发布,迈入百万上下文普惠时代。根据DeepSeek微信公众号,4月24日,DeepSeek-V4的预览版本正式上线并同步开源。DeepSeek-V4拥有百万字超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。模型按大小分为两个版本:deepseek-v4-pro和deepseek-v4-flash。其中,DeepSeek-V4-Pro性能比肩顶级闭源模型,Agent能力大幅提高:在Agentic Coding评测中,V4-Pro已达到当前开源模型最佳水平,并在其他Agent相关评测中同样表现优异;丰富的世界知识:DeepSeek-V4-Pro在世界知识测评中,大幅领先其他开源模型,仅稍逊于顶尖闭源模型Gemini-Pro-3.1;世界顶级推理性能:在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩。DeepSeek-V4-Flash则是更快捷高效的经济之选。相比DeepSeek-V4-Pro,DeepSeek-V4-Flash在世界知识储备方面稍逊一筹,但展现出了接近的推理能力。而由于模型参数和激活更小,相较之下V4-Flash能够提供更加快捷、经济的API服务。在Agent测评中,DeepSeek-V4-Flash在简单任务上与DeepSeek-V4-Pro旗鼓相当,但在高难度任务上仍有差距。 技术突破:定义“效率优先”的下一代AI架构范式。(1)效率的革命性提升。根据魔搭ModelScope社区微信公众号,DeepSeek-V4开创了全新的混合注意力机制,结合压缩稀疏注意力(CSA)和重度压缩注意力(HCA),在token维度进行压缩。V4-Pro在1M上下文下,单token推理FLOPs仅为V3.2的27%,KV缓存仅为V3.2的10%,具有超高上下文效率。(2)Agent能力专项优化。根据DeepSeek微信公众号,DeepSeek-V4针对Claude Code、OpenClaw、OpenCode、CodeBuddy等主流的Agent产品进行了适配和优化,在代码任务、文档生成任务等方面表现均有提升。 战略卡位:深度绑定国产算力,构建自主生态壁垒。根据21世纪经济报道微信公众号,Deepseek表示,受限于高端算力,目前Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调。4月初的公开报道显示,DeepSeekV4已首次实现了与华为昇腾等国产芯片的深度适配。这标志着中国AI产业在摆脱对国外技术生态依赖、推进去CUDA化进程中迈出了具有里程碑意义的关键一步。根据网易科技微信公众号,英伟达CEO黄仁勋在美国知名科技播客主持人德瓦克什·帕特尔(Dwarkesh Patel)的专访中表示,如果DeepSeek这类优秀的开源模型被迫专门针对华为等本土硬件进行深度优化且运行效果最佳,客观上将直接削弱美国技术栈的全球优势。他认为主动放弃全球第二大市场将迫使中国建立独立于美国的底层计算架构。随着这些基于开源标准的技术逐步向全球南方输出,美国极有可能在长期的AI生态标准竞争中陷入被动。我们认为,DeepSeek V4通过优先适配并等待昇腾950,将自身发展节奏与国产芯片量产进度深度绑定,极大提升了国产算力产业链的战略价值和业绩确定性。 建议关注:(1)算力:
寒武纪、
海光信息、
中科曙光、
华丰科技、
申菱环境、
英维克、
飞龙股份、
欧陆通、
中恒电气等;(2)AIDC:
东阳光、
协创数据、
科华数据、
云赛智联、
润建股份、
润泽科技、
数据港、
杰创智能、
大位科技等;(3)AI应用:
金山办公、
科大讯飞、
福昕软件、
万兴科技、
鼎捷数智、
汉得信息、
能科科技、
卓易信息、
星环科技、
普元信息等。 风险提示:下游景气度不及预期;政策推进不及预期;技术创新不及预期、行业竞争加剧。注:内容来自网络,未经核实,不构成任何投资建议,请谨慎参考!如有侵权,请私信联系删除!欢迎各位老师点赞、评论、转发,谢谢!㊗️各位老师发大财、股市长虹!
作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。