DeepSeek近期发布的V4系列模型在Agentic Coding评测中已位居开源模型首位,为Agent产品提供了强大的技术底座。
Harness就是智能体的工程外壳,它负责处理模型本身以外的所有工程动作,包括但不限于:上下文管理、工具调用、文件读写、终端执行、测试反馈以及错误纠正与收敛。
V4系列大模型+ Harness = Agent,因此该最新事件意味着DeepSeek正试图将自身的模型能力转化为实际的桌面端Agent产品,直接对标Anthropic旗下的明星编程智能体产品Claude Code。
预计其桌面端智能体产品将在不久后正式推出。
同时,5月20日,2026阿里云峰会在杭州举行,阿里云围绕“Agentic Cloud”系统展示面向智能体时代的全栈能力。其中阿里发布新一代智能体基座模型Qwen3.7-Max,在三方机构Arena全球大模型盲测总榜中,Qwen3.7-Max超过Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,与GPT、Claude、Gemini最强模型接近,位列国产模型第一。
Qwen3.7-Max面向Agent全新设计,实现了编程、推理等核心能力的突破,可全自主完成35小时的超长程智能体复杂任务。模型泛化能力的根源在于训练阶段对“环境多样性”的重构。Qwen3.7-Max在Qwen3.5的基础上,大幅提升了智能体训练环境的质量与多样性,将RL训练从合成数据推向真实分布,从而掌握可迁移的通用智能体策略。
智谱AI也已推出GLM-5V-Turbo多模态Coding基座模型,Slime框架实现异步强化学习训练与推理解耦,成为全球首款OpenClaw基座模型,API业务ARR达17亿元(同比激增60倍)。
除了巨头加速布局之外,国内相关政策也在加速出台。国家网信办、国家发改委、工信部联合印发智能体应用创新发展实施意见,明确安全可控、规范有序、创新驱动、应用牵引四大原则,提出夯实技术底座、守牢安全底线、强化应用牵引(覆盖科学研究、产业发展、提振消费、民生福祉、社会治理19个典型场景)、建设创新生态四大举措,为智能体规模化落地提供制度保障。
近几年,关于智能体的定义正在快速演进,关键要素包括自主规划、调用工具、记忆管理、反思迭代、多体协作,智能体已经能够独立完成诸多人类无法完成的任务,企业愿意为智能体解决实际问题的能力付费,正式迈入agentic时代。

作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。