主要观点:
1. 云天励飞的芯片是DeepSeek推理芯片首选。梁文锋的家乡湛江自DeepSeek发布以来,从2025年3月开始就上线了湛江政务云, 2026年初,开始打造中国首个全栈国产AI推理千卡集群的“AI渗透之城”项目,正是依托DeepSeek提供的算力支持,而该项目的核心由云天励飞打造(首期4.2亿订单),云天励飞的芯片是DeepSeek推理芯片首选。
2.云天励飞规划了三代芯片产品,公司希望将成本进一步降至“百万Tokens0.1分钱”,打造真正的“Token工厂”。公司提出“PD分离”架构:2026年(第一年):打造第一代超节点P芯片,面向百万级长上下文场景进行Prefil推理优化,算力水平对标Hopper架构;2027年(第二年):研发第一代超节点D芯片,聚焦Decode推理的低时延目标,算力水平对标Blackwel架构;2028年(第三年):推出第二代超节点D芯片,面向毫秒级推理时延目标进一步优化,带动Prefil与Decode性能提升,算力层面有望看齐下一代Rubin芯片
一、云天励飞:DeepSeek推理芯片首选
在梁文锋的家乡湛江,自2025年初DeepSeek-R1发布后,湛江即完成本地部署——基于国产技术栈的DeepSeek-R1大模型率先在湛江政务云上线。2026年,湛江市启动“AI渗透之城”新质生产力基础设施建设项目,该项目将建成中国首个全栈国产AI推理千卡集群,为人工智能技术在湛江各行业的深度应用提供关键的算力支撑。3月12日,云天励飞中标湛江市AI渗透支撑新质生产力基础设施建设项目,中标金额4.2亿元。
湛江市 “AI渗透之城”项目的核心内容是由云天励飞打造的中国首个国产AI推理千卡集群。为什么三线城市湛江可以打造推理千卡集群?主要原因在于DeepSeek的强力支撑,云天励飞作为湛江首批城市合伙人,一定程度上说是DeepSeek的合伙人。
为什么湛江的AI推理千卡集群要依靠云天励飞来打造?在于云天励飞在算力、存储与网络之间的协同能力。

在大模型应用场景中,推理系统通常需要同时满足高并发、高吞吐与低延迟三项要求。为提升整体效率,当前业界普遍采用“Prefill–Decode分离”的推理架构,通过对不同阶段进行资源优化,实现系统性能的整体提升。
其中,Prefill阶段主要负责对长上下文进行理解和计算,计算量大、带宽需求高;而Decode阶段则负责持续生成Token,对系统延迟更加敏感。如何在两个阶段之间进行合理的资源配置,成为推理系统架构设计的重要问题。
与此同时,随着大模型上下文长度不断增加,大量中间状态需要以KV Cache的形式存储。业内普遍认为,未来推理系统的性能瓶颈将越来越多来自数据访问效率,而不仅仅是计算能力。
在这一背景下,算力、存储与网络之间的协同设计,正逐渐成为AI基础设施的重要竞争力。
此次在湛江落地的千卡推理集群,正是围绕这一思路进行构建。
该集群采用云天励飞自主研发的AI推理芯片,并在系统架构上确立了“优先优化Prefill、兼顾Decode”的技术路线。通过在芯片设计中对计算资源与存储带宽进行针对性配置,使系统在长上下文推理场景下依然能够保持较高的吞吐效率。
简单罗列一下云天励飞的优势:
技术核心亮点
芯片:DeepEdge10 / X6000 加速卡
模型:DeepSeek-R1 1.5B/7B/32B/671B MoE、DeepSeek-V4
优化:显存占用减半、推理速度提升约 3 倍
优势:信创+政务+城市治理刚需场景,替代海外算力。
更重要的事,在更长期的规划中,云天励飞提出“1001计划”,即以“百亿Token一分钱”为长期目标,通过芯片与系统协同优化持续降低大模型推理成本。
事件:“龙虾"市场火热带动边缘侧市场需求与推理算力需求。现阶段,“龙虾"市场火热,3月8日,深圳龙岗拟出台“龙虾十条"措施支持OpenClaw;3月9日,无锡高新区发布《关于支持OpenClaw等开源社区项目与OPC社区融合发展的若干措施(征求意见稿)》;腾讯云工程师协助完成OpenClaw云端安装,云上"养虾人"规模突破10万。
公司上一代芯片商业化迎接边缘端发展。公司现有商业化芯片为DeepEdge系列芯片,DeepEdge10选择基于国内自主可控的14nm工艺,采用了基于D2D(Die to Die)互联的Chiplet先进封装架构,可实现单Die16T算力,单芯片128T,一张加速卡256T的推理架构,产品主要为迎接边缘端侧发展。“龙虾"的部署多为端侧,所执行的任务为A模型的推理应用,对推理算力需求快速提升,公司作为布局边缘侧算力与推理算力市场的企业有望因此受益。
公司2月3日举办“大算力芯片战略前瞻会",对外公布未来三年的大算力A推理芯片战略布局。公司在会上提出“训练追赶、推理超车"的战略方向,并发布了基于"PD分离"思路的芯片路线图。公司致力于持续降低百万Token的成本,目标是通过下一代芯片实现百万Tokens一分钱"。未来三年,公司希望将成本进一步降至“百万Tokens0.1分钱”,以加速大模型应用的规模化落地。
公司提出“PD分离”架构,三年规划三代芯片。公司基于对大模型推理计算特征的理解,按照“PD分离“的系统架构规划两类大算力芯片:P芯片(Prefil):面向计算密集型需求设计,满足Prefi阶段的高算力要求;D芯片(Decode):面向访存密集型需求设计,满足Decode阶段的高带宽需求。在一个包含1024颗芯片的超节点内,P芯片与D芯片可实现有效组合,以满足大模型云推理的集群化部署需求。未来三年,云天励飞规划了三代芯片产品:2026年(第一年):打造第一代超节点P芯片,面向百万级长上下文场景进行Prefil推理优化,算力水平对标Hopper架构;2027年(第二年):研发第一代超节点D芯片,聚焦Decode推理的低时延目标,算力水平对标Blackwel架构;2028年(第三年):推出第二代超节点D芯片,面向毫秒级推理时延目标进一步优化,带动Prefil与Decode性能提升,算力层面有望看齐下一代Rubin芯片。
投资建议:公司部署A|算力到应用全产业链,多项平台技术优势明显。此外,公司多方向开拓Al市场,通过企业级、消费级、行业级三方向渠道开拓,销售额增长显著。后续随着自研芯片及相关产品在云端推理市场,公司营收有望迎来快速增长。我们预计公司2025-2027年营业收入为12.85、15.84、19.36亿元,当前股价对应PS分别为28X、23X、19X,维持"推荐"评级。
附:报告原文

三、参考资料及数据来源
本报告来自券商报告的分析和解读,主要部分来自:
【国联民生计算机】云天励飞:“龙虾”国产推理算力的核心受益者。吕伟,2026年3月9日。
【人工智能产业工委会】成员动态:云天励飞千卡AI推理集群落地,打造“国模国芯”生态样板。2026年3月17日官方微信。
【湛江发布】DeepSeek创始人家乡,中国首个国产AI推理千卡集群落地。2026年3月12日,湛江官方微信。
作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。