AI 从 “对话生成” 进入 “自主执行” 的 Agent 时代后,算力瓶颈正从 GPU 的并行计算能力,转向 CPU 的任务调度、逻辑编排、系统管理能力。CPU 从算力配角升级为智能体的 “调度大脑”,是当前 AI 算力链中被显著低估的核心增量赛道。
这句话核心是什么:就是Agent时代,算力对逻辑芯片需求爆发,特别多线程处理CPU。
Agent 时代 CPU 价值重估的底层逻辑
1. 工作负载本质切换:从并行运算到逻辑调度
传统大模型训练、简单问答推理以矩阵运算为主,GPU 是绝对主力;但 Agent 需要自主拆解任务、调用工具、管理运行状态、处理 IO 交互,属于串行逻辑密集型任务,天然适配 CPU 的通用计算能力。产业测算显示,智能体全链路工作流中,CPU 侧耗时占比可达50%~90%,是决定端到端延迟的核心因素。
2. 服务器 CPU/GPU 配比大幅重构
过去训练主导的 AI 服务器中,单台服务器 CPU 的核数、缓存、价值量提升 3~4 倍,英特尔、英伟达等巨头均已确认该架构趋势。
3. 沙箱机制与长任务放大 CPU 消耗
每个 Agent 独立运行在沙箱环境中,为保障稳定性资源超额预留,当前实际利用率仅 10% 左右;同时 Agent 的长任务(代码执行、数据分析、多工具串联)会持续占用 CPU 核心,并发率从传统对话的 1% 飙升至 30%~40%,需求呈指数级增长。
4. 端侧 Agent 推动终端 CPU 升级
端侧智能体需要本地 CPU 承载轻量化推理 + 任务调度,推动 AIPC、边缘终端 CPU 的单核性能、核数、缓存全面升级,单台终端 CPU 价值量翻倍。
====================
再说禾盛新材
股权卡位:先参后并,绑定国产 ARM CPU 厂商
公司两轮增资后,成为熠知电子第二大股东,并存在后续增持预期。熠知电子是国内少数实现商业化落地的 ARM 服务器 CPU 设计企业,拥有 ARM V9 架构授权,核心团队来自微软、AMD;其第三代 TF9000 系列为 “CPU+NPU” 异构 AI CPU,性能对标英伟达 Grace,已进入国内头部互联网厂商、运营商供应链,实现批量出货。
公司控股子公司海曦技术主营 AI 服务器、AI 一体机,可直接搭载熠知 CPU,形成 “芯片设计 - 整机组装 - 方案交付” 的完整链路,已推出可本地运行大模型的 AI 一体机,向下游客户交付完整算力方案。
从ARM构架CPU到服务器闭环!!!!!!!!
转型的核心产业背景是:Agent 时代算力重心从 GPU 并行训练转向 CPU 任务调度,CPU 的需求规模与价值量大幅提升;同时国产 ARM CPU 迎来替代窗口,公司以参股方式低成本切入赛道,传统家电主业的稳定现金流为新业务持续输血。
-------------------------------------------附谈:ARM 架构在 Agent 时代的核心优势
能效比优势显著,适配高密度部署
Agent 属于长驻、高并发的轻量逻辑任务,对持续算力密度、功耗成本高度敏感。ARM 架构天生低功耗,同性能下功耗仅为 x86 的 1/2~1/3,可大幅降低数据中心电费、散热成本,更适合大规模 Agent 集群的高密度部署。
原生多核架构,适配多任务调度负载
Agent 需要并行处理任务拆解、工具调用、沙箱隔离、状态管理等多线程逻辑工作流。ARM 架构的原生多核设计,在并发调度吞吐量上更具优势,能高效支撑 “串行逻辑 + 轻量并行” 的混合智能体任务。
异构集成灵活,匹配 “调度 + 轻推理” 混合需求
ARM 架构可灵活集成 NPU、安全引擎、IO 控制器,形成 “CPU 负责逻辑调度 + NPU 承接本地轻推理” 的异构方案。Agent 大量的意图识别、简单推理可在 CPU 端本地完成,无需频繁跨芯片调度 GPU,显著降低端到端延迟。
云边端统一生态,适配全场景落地
从云端服务器、边缘节点到端侧 AIPC / 智能终端,ARM 架构可实现统一的指令集与软件生态,Agent 应用能低成本跨场景迁移部署,适配智能体云边端协同的产业趋势。
可定制化程度高,支持定向优化
相比 x86 的封闭架构,ARM 开放 IP 授权模式允许厂商针对 Agent 的任务特征,定制扩展指令集、优化缓存与调度机制,实现比通用架构更高的任务执行效率。
作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。