我们不预测DeepSeek V4的发布时间,我们只做好跟踪(0402)@华泰计算机
最近DeepSeek的信息多了起来,帮大家梳理下,资料来源:晚点LatePost;网络公开信息。
DeepSeek正处在转折期。从2025年下半年至今,已有多位核心成员离开并流向外部:王炳宣被腾讯挖走,他是DeepSeek LLM核心作者,后续参与历代模型训练;魏浩然离开,他是DeepSeek-OCR核心作者;郭达雅离开,他是DeepSeek-R1核心作者;阮翀更早离开,后加入元戎启行,他是从幻方时期就加入的老成员,也是Janus-Pro等多模态成果的核心贡献者。
梁文锋的重心在变化。从2025年秋天起,他开始更多提产品化和商业化。DeepSeek已有小数十人的产品团队,但还没有进入AI编程、通用Agent等热门方向,C端仍主要是Chatbot。与此同时,DeepSeek人数已经超过幻方,成为梁文锋管理过的最大组织。
DeepSeek的底层组织方式没有变。公司不打卡、不加班、没有明确绩效和DDL,多数成员平时6点到7点离开公司。内部仍是高密度人才驱动的“自然分工”,研究员可以自由组队,也可以长期做未必短期出成果的研究。梁文锋本人参与最多的仍是基模架构团队,并与团队共同确定每一代基模的架构方向;与之配套的Infra和数据团队也各有小几十人。
技术路线上,DeepSeek仍很克制。没有重点押注多模态生成,因为梁文锋认为这不是智能主线;同时会投入国产GPU适配,以应对高性能GPU受限的问题。到DeepSeek-V3.2,其底层算子库甚至已从CUDA、Triton(OpenAI开源)转向TileLang(北大开源)。
资本层面,DeepSeek一直很特殊。2023年梁文锋曾接触部分投资人,但提出了一个少见条件:希望投资方接受类似OpenAI—微软那样的回报上限机制。最终这一轮没有机构投资DeepSeek。
外界当前最关注的是V4。已有消息称DeepSeek V4可能在4月发布。判断上,它大概率仍会是开源最强模型之一,但未必再是过去那种单一标准下的“碾压式领先”,因为现在不同场景对“强”的定义已经分化。
另据网络公开信息,DeepSeek最近已开启新一轮灰度测试。现有反馈集中在三点:代码能力提升,尤其是SVG生成;多轮搜索和信息整理能力提升;思考过程中的分步修改能力提升。结合此前有关V4大版本的说法,外界猜测这次灰测对应的可能就是V4的大参数版本,若测试顺利,可能很快上线。
作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。