翻开最近一季的英特尔、AMD、Arm财报,再对照几场国内外关于 Agent AI 的技术会,很容易看到一个略显讽刺的画面:过去几年被资本市场持续压估值的通用 CPU,如今在 AI 数据中心里,反而成了香饽饽。
这篇文章想做三件事:
第一,厘清一个被明显误读的趋势:CPU 为什么在 Agent AI 阶段重新站到台前,它的需求究竟是结构性增长,还是被内存价格和渠道囤货放大出来的“表面繁荣”。
第二,沿着供需与利润这条线,把 CPU 产业链从上游制程、设计,到中游配套、封测,再到下游 OEM,重新排一遍优先级,区分出真正的利润集中环节和典型的周期噪音。
第三,回到投资,把“海光信息—澜起科技”为代表的一条国产链条,放到全球竞争格局里审视,讨论它是否配得上当前估值溢价,以及在什么情形下,这条逻辑会被后续事实推翻。
CPU 从“打杂”到“总指挥”要理解今天的 CPU,先要承认一个常被忽略的事实:AI 早就不再停留在“一个大模型坐在那儿答题”的阶段。
预训练时代的 AI,本质是把几十万块 GPU 堆在一起,把海量文本炼成参数矩阵。CPU 主要做预处理、数据切分、喂给 GPU,以及简单的训练任务编排,很少被视作瓶颈。
Agent AI 把分工改写了。
一个成熟的 Agent,需要做的事情远比补全一句话复杂:要上网搜索,要多次调用外部工具,要在代码沙箱里执行,要操控复杂 GUI,还要在这些动作背后维持一个稳定的状态机,让流程能够回退、纠错和继续推进。
这些具体工作里,多数都落在 CPU 侧:
请求的统筹与调度工具调用的解析与编排状态记录与回退逻辑多 Agent 并发下的任务分配与资源协调这不是观点,而是测量数据给出的结果。来自 Georgia Tech、Intel 等机构的研究显示:在 RAG、联网搜索 Agent、科研计算等典型 Agent 任务中,CPU 端到端运行耗时占比可以超过总耗时的 80%,在中大批量任务下,CPU 能耗占比可达 60%。反观 GPU,即便算力很高,如果 CPU 侧调度和前后处理跟不上,GPU 只能空转。
过去一段时间,产业选择对这一点保持沉默。大家盯着 GPU 每年翻倍的 TFLOPS,把延迟、吞吐的瓶颈归因于网络、框架或软件,而很少愿意承认,标准配置里的 CPU 已经跟不上新的工作负载。
直到 Agent 大规模并发跑起来,这个问题才被迫暴露。
当一个数据中心需要同时承载成千上万个 Agent,每个 Agent 又由多轮“思考—调用—执行—反馈”组成,CPU 的并发能力就不再是个可以靠“优化几行代码”来解决的小问题,而是直接决定响应速度、服务成本的硬约束。
旧时代的配比逻辑也因此瓦解。
从训练阶段“1 个 CPU 带 8 个 GPU”,到推理阶段“1 个 CPU 带 4 个 GPU”,再到英特尔、AMD 在最新财报电话会里的展望:在 Agent 负载下,他们自己预期 CPU/GPU 配比会向 1:1 演进,甚至有 CPU 端反超的目标区间。Arm CEO 给出的数字更直观:传统 AI 负载下,每 GW 数据中心容量约需要 3000 万个 CPU 核心,而在 Agent 负载下,这个数字会提高到 1.2 亿,放大四倍。
如果认为这些只是芯片厂商的“话术”,可以看一眼微软 Fairwater 新一代数据中心的设计:一栋高密度 GPU 楼,旁边是单独一栋跑 CPU 和存储的风冷楼,中间用 300Tb/s 以上的网络相连。GPU 负责大规模矩阵计算,CPU 负责任务规划和资源调度,两者各自独立,而不是 CPU 挂在 GPU 后面做辅助。
在这种新结构下,再用“CPU 是否被边缘化”来描述算力布局,基本已经不贴切。
供给被制程约束,需求被 Agent 推高:涨价与缺货从何而来确认 CPU 再次处于系统核心位置之后,下一步问题是:当前的涨价和缺货是需求改变导致的,还是半导体周期里常见的一轮价格上行?
先看供给端。
目前能稳定大量提供高性能服务器 CPU 的,主要是 Intel 和 AMD。前者是 IDM,后者依赖台积电代工。但这两条产能链路在过去两年的实际安排,都没有把 CPU 放在最高优先级。
台积电的 3nm、5nm 等关键产能,首先给了英伟达、苹果、高通等高毛利产品。高端 GPU 和移动 SoC 排产优先,服务器 CPU 在产能争夺中处于劣势。AMD 在最新财报中承认:将数据中心 CPU 的市场空间预期从 600 亿美元上调到 1200 亿美元,但实际出货能力受限于台积电产能,短期很难完全对齐需求。
Intel 的情况略有不同。18A 节点被寄予厚望,但今年年初良率刚刚过内部设定的下限,真正的大规模量产要往后看。为了应对突然增加的服务器 CPU 订单,Intel 首先选择压缩或延后部分 PC 端产品,把晶圆、封装、测试资源优先分配给数据中心芯片。换句话说,可灵活调配的资源已经部分消耗在这轮调整里。
再看需求端,需要分开两个力量:Agent 带来的结构性变化,以及存储价格带来的订单行为变化。
从去年三季度开始,北美几家云厂的行为发生了明显改变。Google、亚马逊、Meta 集体追加的是上一代服务器 CPU 的长期订单,而不是只谈最新产品。戴尔与 Intel 对话时提出的加单量,是在原定 2025 年全年采购基数上的“额外一倍”。最终双方折中为增加约 60% 的量,对应 3—6 个月的交付周期。
把主要 OEM 的加单合并,Intel 发现,第五代服务器 CPU 的订单比原定产能高出大约 45%。无论台积电还是 Intel 自己的工厂,都不可能在短期内无成本扩出这 45%。结果就是一个清晰预判:3—6 个月的缺货期,基本不可避免。
与此同时,存储厂商三星、美光、海力士共同减产并提价。DDR 内存和 SSD 的合同价在两个季度内上涨了 50%–100%,机械硬盘价格也有翻倍水平。服务器主配置变化不大的情况下,整机出货价在一年内翻了一倍。
一个具体案例:某客户去年 2 月购买了 4 台 Intel CPU 服务器,总价约 60 万元人民币;今年春节后再买 3 台配置完全一致的服务器,总价约 100 万元。单价从每台约 15 万上涨到约 33 万。这不是某一家的单独涨价,而是 CPU、存储和其他配件叠加的结果。
在这种环境里,无论是云厂,还是银行和运营商,都要在两种做法之间选择:现在多花钱锁定硬件和价格,还是押注未来成本回落、暂缓扩容。从现实行为看,多数选择了前者:能囤就囤,能签长约就签长约。每一份真实需求都被叠加了预期因素,变成两三份订单,渠道库存很快被占满。
但是,把 Agent 和存储价格的因素叠加来看:
一方面,Agent 确实带来了 CPU 配置的结构性增量——从 1:8 的 CPU/GPU 配比,向 1:4、1:1 甚至更高 CPU 比例过渡,每个 AI 集群中 CPU 节点显著增加;
另一方面,存储产品涨价和渠道囤货,把原本分布在未来几季的订单集中到当前,放大了短期需求表现。
再看一组不那么好看的数据:根据 Intel 内部对 2026 年的预估,全球服务器总销量同比会下降约 2%,中国 x86 服务器销量同比下降约 5.6%。GPU 服务器的出货在增加,但通用 x86 服务器的“台数”在减少,只是由于单机价格上涨较大,掩盖了数量上的下降。
在这个背景下,把 CPU 涨价完全归因于“AI 需求爆发”,显然不完整。
利润流向:谁在提升盈利,谁在被压缩供需结构变化之后,更关键的问题是:利润在产业链上如何重新分配?
首先,CPU 设计厂是当前周期中受益最直接的一环。
英特尔在今年一季度表示,服务器 CPU 的第一轮涨价已经在春节前后完成,按核心数分档:32 核及以下产品涨价约 20%,更高端产品涨价约 10%–15%。第二轮涨价预计在 5 月中下旬执行,内部普遍按接近 20% 的幅度测算。AMD 起初未跟进,但在看到渠道表现后,也计划在 6—7 月间执行一次 10%–15% 的整体提价。
对 AI 服务器而言,CPU 在整机成本中的占比大致为 5%–10%。上游 CPU 涨价 20%,对单台整机价格的影响大概在几千元以内。对于动辄几十万、甚至上百万的 AI 集群订单,这部分增量并不会改变客户决策;在 GPU、内存已经推高整机价格的前提下,CPU 的涨价对采购方的敏感度进一步降低。议价权因此从下游 OEM 和大客户,重新回到上游设计厂手中。
AMD 的 Q1 财报给出了直观的结果:公司总营收同比增长 38%,数据中心业务营收同比增长 57%,服务器 CPU 收入已经连续四个季度刷新历史纪录。与此同时,管理层将服务器 CPU 的长期市场容量预期从 600 亿美元调整到 1200 亿美元,对应年复合增速预期超过 35%。收入表现和管理层预期形成自洽:价格抬高之后,叙述空间也随之放大。
但利润并没有只停留在 CPU 设计厂。
每增加一颗 CPU,数据中心内部需要配套更大的内存容量、更高的内存和 I/O 带宽、更长的走线和更多的信号修复节点。
这一轮里,部分处于“配角位置”的公司开始明显受益。
澜起科技是一个典型例子。它的 DDR5 内存接口芯片 RCD 是高端内存条上的必备器件,负责在高频环境下保证 CPU 与内存之间的信号质量。同时,澜起也供应 PCIe Retimer(重定时器),用于长距离 PCB 或背板传输中的高速信号整形,保证到达 GPU、CPU 端时仍然可识别。
DDR4 时代,很多服务器在内存侧主要靠“堆条子”来增加容量,RCD 和 Retimer 的价值量相对有限。但在 Agent 负载下,内存需求已经不仅是容量的问题。Agent 要维持长期上下文,需要跨节点共享内存资源,这推动了 CXL 等新协议加速落地。
CXL 控制芯片的单价一般在几十美元级别,一块支持 64 条内存的 CXL 扩展板,常规需要配备约 32 颗控制器,总价值可以达到约 3000 美元。随着 CXL 标准从 2.0 升级到 3.0,可连接节点数从几十台扩展到上千台,对控制芯片的需求增速将明显高于传统内存控制芯片。
类似趋势也出现在 MRDIMM 这类新型内存模组上。MRDIMM 在带宽与容量之间做了重新平衡,被用来缓解 H100/H200 等高带宽 GPU 显存容量有限、而传统 DRAM 容量大但带宽不足的矛盾。一个 MRDIMM 模组需要一颗 MRCD 和若干 NDB 芯片,整体价值往往超过 100 美元,是传统 RDIMM 的数倍。
综合来看,CPU 数量和规格的升级,使得内存接口、PCIe 互联、CXL 扩展等配套芯片的单机价值被系统性放大。它们和 CPU 一样,是当前结构变化下的直接受益者。
对比之下,服务器 OEM 的位置不那么理想。
浪潮信息、中科曙光、华勤技术、工业富联等厂商,在这一轮中同时面临两个压力:上游 CPU、内存、GPU 集体涨价导致整机成本大幅增加;下游客户虽然在短期恐慌期接受了部分价格上调,但在整体经济增速放缓的背景下,服务器出货台数难以维持高增长。OEM 缺乏对上游的议价能力,同时又不敢完整传导成本,只能通过压缩毛利来维持客户关系。
所以,即便承认 AI 算力投资会在较长时间内持续存在,也需要在产业链上做出区分:利润主要集中在 CPU 设计和关键配套芯片环节,OEM 以及部分封测、载板环节,则更多承担周期波动带来的压力。
国产链条:被动导入与估值放大在全球供需重新调整的同时,还需要单独看一条国产链条。
如果没有美国的出口限制,国产 CPU 大概率会在“信创试点+军工特种”的小规模市场里缓慢前进。但外部环境加速了导入节奏。
英伟达高端 GPU 被禁后,国内互联网公司最初的做法并不是立即大规模采购国产方案,而是通过各种渠道继续获取海外 GPU,并优先保证训练集群。推理侧的算力才开始尝试国产 GPU 和 CPU,只要英伟达的训练平台还在,大家不会主动替换一个成熟生态。
真正改变节奏的,是全球 CPU 缺货叠加涨价。海外云厂追加订单时,天然地排在优先队列前面,国内客户即便愿意付更高价格,也往往只能排在后面。在“有预算但拿不到货”的情况下,国产方案从“可选项”变成了“必须认真评估”的对象。
海光信息在这里的角色比较关键。它拥有 x86 永久授权,产品在指令集和生态层面与 Intel、AMD 高度兼容,可以直接运行主流操作系统、数据库和中间件。早期,海光主要服务于金融、电信、党政等有国产化指标的行业,被归类在“信创”范畴。但随着通用 CPU 供货紧张、价格上调,互联网企业开始在更多负载上测试并导入海光。
过去一年,海光服务器 CPU 在传统信创市场的渗透继续推进,同时在阿里云等商业云平台上实现了更大规模的上架。它从一个以“合规”为主的选择,转变为在成本、供给和性能综合权衡下的实际选项。配合自研 DCU(深度计算单元),海光在“CPU+AI 加速”一体机方向上也形成了一定差异化。
龙芯中科、中国长城、国芯科技等厂商,则分别围绕 LoongArch、Arm 和 RISC-V 三种架构布局党政军、嵌入式和安全等场景。它们的挑战主要不在于性能完全无法使用,而在于生态成熟需要时间,客户从原有架构迁移到新架构、并确保业务稳定,通常需要数年,这与资本市场对盈利改善的时间期待并不匹配。
在配套方面,澜起科技几乎参与了所有主流国产 CPU 方案。它的内存接口芯片不仅要通过 Intel、AMD 平台验证,也要与国产 x86、LoongArch、Arm 平台联合调试;在 CXL 联盟中,澜起已经成为最早完成标准认证的厂商之一,这让它在未来“内存池化”场景下具备先发优势。
整体来看,国产 CPU 产业链的真正拐点,不在于出台了多少政策文件,而在于海外供给的不稳定和国产产品“功能上能用、价格上可接受”之间形成了实际交叉点。海光、龙芯、飞腾,以及澜起、聚辰、通富微电、长电科技等配套厂,都是在这种被动但真实的导入过程中,获得了规模化商业订单。
在资本市场上,这种情况很容易触发估值与业绩的双向放大:一端是利润表上有可见的增长,另一端是估值锚从“政策驱动+PC 周期”,转向“AI 投入+供给安全”的新假设。
最大的预期差:价升量跌还剩一个环节:风险和预期差。
当前关于 CPU 的叙述,大致可以归为一条线:Agent AI 提高了 CPU 重要性,供给短期跟不上,缺货、涨价是自然结果,CPU 厂商接下来将迎来“量价齐升”的阶段,估值需要大幅重估。
问题出在“量价齐升”这四个字。
前文提到,Intel 对 2026 年的判断是全球服务器销量同比小幅下降,中国 x86 服务器销量同比下降超过 5%。在整机价格翻倍的背景下,服务器出货台数仍然下滑,“量价齐升”很难成立。更准确的描述是:价格上升、台数下降,CPU 厂商借机恢复了部分议价能力,这同时是在透支绑定在它们上游的整个服务器生态的增长空间。
进一步看,最近这波CPU 涨价的触发点并不完全来自 AI 需求,而是跟存储价格的上行高度同步。时间上甚至存在一定滞后,更像是一种对整机成本通胀的跟随。存储本身具有明显周期性,一旦后续扩产过度,价格回落往往比较迅速。如果那时 CPU 价格还停留在当前区间,厂商要在“降价保出货”和“维持价格但接受订单减少”之间做选择。
这在过去几轮 PC 和手机 SoC 周期中都出现过。
另一个被低估的变量,是互联网公司的资本开支分布。年报中,阿里、腾讯、字节及几大运营商都强调未来几年会持续增加算力投入。但具体拆分可以看到,很多预算实际流向国外 GPU 服务器订单,国产 CPU 服务器的量,并没有想象的那么大。
在这样的背景下,如果简单认为国产 CPU 会成为国内算力建设的最大受益方,仍然缺乏足够的数据支持。
把这些因素放在一起,一个更克制的判断是:
– CPU 在 AI 负载中的重要性确实在提升,Agent 和 CPU/GPU 配比的变化是长期方向;
– CPU 厂商短期业绩改善有现实基础;
– 国产 CPU 产业链的放量,与供给安全诉求之间有逻辑上的自洽;
– 但这一轮涨价中,包含了较大比例的成本通胀和预期拉动;
– 利润从下游 OEM 向上游集中的过程不可能持续,存储价格回调、Intel 新制程良率提升、云厂 CapEx 节奏变化,都可能打破目前的价格和出货结构。
对专业投资者来说,厘清这些前提,比寻找一个简单结论更重要。
对投资者的直接含义回到投资层面,很难用“全面乐观”或“全面回避”来概括这一轮 CPU 相关机会。
从产业链角度看,适合长期关注的仍然是两类公司:
掌握架构和生态主导权的 CPU 设计公司:Intel、AMD、海光、龙芯、飞腾等;在内存接口和互联芯片上,因系统结构变化而单机价值明显提高的公司:以澜起科技、聚辰股份等为代表。它们的商业模式有一个共同点:不靠大规模扩产和价格战来获取市场,而是通过产品迭代和与平台绑定,提高单位产能的价值和订单稳定性。在 Agent 负载仍然演进、CPU/GPU 配比向 1:1 靠拢的前提下,它们在产业价值分配中的位置,很难再回到之前那个被忽视的状态。
而 OEM、部分封测、载板、PCB 厂,更大程度上承担了周期波动:涨价时收入上升,价格回调时利润被压缩。如果整体服务器台数进入下行区间,这些环节甚至可能在报表上显得更“难看”。这类公司可以有阶段性交易机会,但把它们当成“AI 长期核心持仓”并不符合它们在链条中的位置。
对于“CPU 会复制 GPU 行情”这类想法,更合适的做法是作为情绪信号记录,而不是直接用来指导建仓。GPU 今天的地位来自十多年持续的软件和硬件投入;CPU 即便重新变得重要,它的增长路径和估值轨迹,很难重复 GPU 的那一套。
接下来更值得跟踪的是一些可量化指标:
Intel 18A、AMD 2nm 等节点的良率与产能爬坡;头部云厂在 Agent 服务上的真实并发量、延迟指标变化;全球服务器出货台数的同比变化,尤其是 x86 服务器部分;澜起、海光等公司在互联网、金融、电信等行业实际签下的中大型项目。未来最重要观察时间点:2026年6月AMD涨价实际执行情况,以及2026年Q2服务器出货量数据验证“量价背离”程度。只有等这些数据在未来几个季度陆续呈现,才能更清楚地判断:这轮 CPU 从“打杂”到再次成为系统核心,是阶段性现象,还是一场持久的产业结构重构。
在此之前,更合理的态度是:保持对数据的敏感,尽量减少对单一叙事的依赖。
作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。