云天励飞独家中标4.2亿AI推理卡,建设首个面向行业应用的国产AI推理千卡集群

2026-03-12 17:18:453
今天(3月12日),云天励飞独家中标湛江市AI渗透支撑新质生产力基础设施建设项目,中标金额达4.2亿元。项目将以云天励飞自研国产AI推理加速卡为核心,建设首个面向行业应用的国产AI推理千卡集群,重点服务政务与产业场景等的AI推理需求。该平台计划适配DeepSeek等国产大模型,通过国产模型+国产芯片的技术组合,为传统产业提供低成本、可规模化的AI能力,探索形成国模国芯的AI应用生态。


在建设节奏上,该项目将分三期推进,一期部署云天励飞X6000推理加速卡,后续阶段则将引入云天励飞未来推出的新一代芯片产品。这种分阶段演进的方式,一方面能够快速形成可用算力,另一方面也为新架构芯片提供持续升级空间,使算力平台能够随着模型与应用需求的变化不断迭代。
湛江项目以推理为核心目标,意味着AI数字基础设施建设正在更加贴近真实应用需求,明确了AI基础设施的发展方向正在由训练向推理侧延伸。过去几年,算力竞争主要围绕训练性能展开,但随着大模型逐步进入应用阶段,产业需求开始转向推理效率与单位成本。推理算力的优化重点不再是单次峰值性能,而是持续高吞吐与能效比,这直接决定了AI服务能否规模化进入政务与实体产业。
该项目体现了国产算力体系在系统级架构上的探索。千卡级集群不是简单的算力堆叠,而是需要在芯片、互联网络和调度系统之间形成整体协同。云天励飞在架构设计上提出优先优化Prefill、兼顾Decode的技术路线,使系统在长上下文推理任务中仍能保持稳定吞吐。同时,通过对计算资源与存储带宽进行针对性配置,提升了大模型推理场景下的整体效率。这种针对推理负载特征进行定制化设计的思路,国产AI芯片正从单点性能竞争转向系统级效率优化。
在基础设施层面,该集群采用统一的高速互联架构,并通过400G光网络构建物理层通信体系,使节点之间能够实现高带宽、低延迟的数据交换。与传统节点内外使用不同通信协议的网络架构相比,这种同构互联模式减少了协议转换带来的性能损耗,同时也降低了系统部署与运维复杂度。对于千卡级规模的算力系统而言,网络效率往往成为决定整体性能的关键因素,因此这一架构设计有着明显的工程价值。
产业应用上,千卡级推理集群还有望承担验证大规模AI系统工程能力的重要作用。在典型AI算力架构中,大规模集群通常由单节点8卡或32卡系统逐级扩展,形成超节点结构,再进一步连接为跨节点的大规模计算网络。通过实际运行,可以验证卡间互联效率、节点通信稳定性以及任务调度与负载均衡等关键技术,为未来更大规模算力平台提供可复制的技术路径。
综上,总体看,湛江项目凸显出AI产业正在从训练驱动过渡到应用驱动。当推理成本下降、算力部署更接近行业场景时,AI技术才将真正渗透到政务治理与传统产业生产体系之中。国产AI推理千卡集群的落地,为这一阶段的产业演进提供了一个具有代表性的实践。

作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。

合规声明:本站发布的所有文章及观点均系个人研究共享,投资心得交流,不代表本站立场,且不构成任何形式的投资建议。投资者据此操作,风险自担,请务必保持独立审慎的决策态度。