算力通胀的演绎节奏

2026-03-20 07:58:416

从今年1月中旬说起我们观察到海外AI应用生态出现了一个关键变化:各种基于大模型的Agent和Coding工具进展飞速,这直接导致了大模型Token消耗量的迅猛增长。从那时起,一个贯穿全年的核心逻辑就确立了:算力产业链将面临持续的通胀压力。


通胀压力的传导,并非一蹴而就,而是像波浪一样,有清晰的节奏和阶段。它始于产业链的最上游、最核心的环节。大约在去年年中,市场首先观察到海外巨头如谷歌、微软的Token消耗量开始指数级攀升,这直接点燃了第一波行情,主角是GPU以及与之紧密相关的光模块、PCB等。因为GPU的算力直接决定了Token的供给总量。随后,涨价和市场的关注点开始向下游外溢。到了今年1月,存储环节(特别是HBM高带宽内存)因为AI应用对内存的巨量需求(例如智能体需要超长上下文记忆)而变得紧张,价格开始上涨。同时,CPU也出现过短暂的涨价预期。

真正的标志性节点出现在1月底2月初。当时,海外的云服务基础设施巨头——亚马逊云(AWS)和谷歌云率先宣布调价,这被视为通胀压力正式从硬件层传导至服务层的信号。但在当时的中国市场,这还仅仅是一个预期。因为国内云服务市场的竞争格局与海外不同,更为激烈,大家都在观望头部厂商阿里、腾讯、字节跳动的动向。如果它们不涨,其他中小云厂商也不敢轻举妄动。因此,当时相关股票的走势是上蹿下跳的炒预期行情。随后,在2月上旬,一些中小云厂商和专业的CDN服务商如网宿科技、UCloud优刻得率先宣布涨价,但市场仍在等待“发令枪”。

直到近期,阿里云、百度云正式宣布涨价,加上此前腾讯对其部分模型API调价、智谱AI等大模型厂商的Token价格也已连续上调,这才彻底确认:算力通胀的浪潮已经无可争议地传递到了云服务这一关键环节。按照这个传导逻辑,下一个可能迎来价格传导的环节,将是更下游的IDC和算力租赁服务。


为什么会出现这种席卷全产业链的算力通胀?根本原因在于一个巨大的、且仍在扩大的剪刀差:AI应用对算力的需求呈指数级爆发,而算力的供给只能线性增长。


在需求侧,驱动力量主要来自三个方面,它们都远比早期的聊天机器人(Chatbot)更耗算力:
-
AI编程(Coding):从简单的代码补全,发展到能端到端完成复杂项目的智能体,其Token消耗量是数量级的提升。它正在渗透和替代程序员的市场,潜力巨大。

- 智能体(Agent):以LangChain为代表的AI智能体框架是当前最火的方向。它与Chatbot有本质不同:它需要持久化记忆用户的历史和偏好;能够规划、执行复杂任务,并调用外部工具(如搜索、运行代码);任务执行中常常需要多轮纠错和迭代;并且可以设定心跳机制7x24小时运行。这使得完成一个任务所消耗的Token量,可能是简单问答的百倍甚至千倍。同时,多智能体协作的兴起,进一步倍增了算力需求。

-
多模态生成:特别是视频生成。根据已公布的价格测算,生成一秒钟视频可能就需要消耗约2万个Token,一分钟就是120万Token,消耗量极为惊人。图片生成的消耗相对较小,但视频无疑是算力吞噬兽。


在供给侧,算力的增长受到多重物理约束。

虽然今年海外主要云厂商公布了非常激进的资本开支计划(增速约70-80%),旨在购买更多GPU和建设数据中心,但这些投入要转化为可用的算力,面临诸多瓶颈:高端GPU(如英伟达的B系列、GB系列)产能有限;数据中心的建设受到电力供应、土地、散热、变压器等基础设施的限制;芯片性能的提升和模型算法的优化(如MoE稀疏架构)确实能提高单位算力的输出效率、降低单Token成本,但这种技术进步是渐进式的。此外,数据中心集群在实际运行中还存在业务负载率等损耗。

因此,综合来看,Token(算力)供给的增长是线性的,远远无法匹配需求的指数级曲线。这个巨大的缺口,就是一切涨价现象的根源——Token(无论是直接调用大模型API,还是通过云服务间接使用)的价格上涨是必然结果。


理解了供需矛盾,就能看清涨价传导的路径和投资逻辑。通胀压力的传导顺序,是从产业链的右侧(上游)向左侧(下游)逐步外溢。这主要由各环节的竞争格局和稀缺性决定:

- 最上游(如GPU、HBM存储、先进封装):技术壁垒极高,呈现寡头垄断格局(如英伟达、三星/海力士),且产能受物理限制最大。当需求爆发时,这些环节最紧缺,也最有定价权,因此最先涨价
- 中游(如云服务、IDC):厂商数量增多,竞争更为激烈(尤其在国内)。虽然他们也面临成本压力,但涨价需要勇气和时机,往往要等到头部厂商行动后才会跟随,因此涨价传导至此需要时间,且确定性相对弱一些
- 下游(应用):最终,部分成本可能会向终端用户传递。


因此,对于市场表现和投资策略,可以这样理解:

- 短期节奏:市场资金倾向于追逐边际变化。当前云服务刚刚开始涨价,所以成为短线热点;接下来,市场可能会预期IDC环节的传导,从而炒作IDC。这是一个跟随涨价波浪向下游移动的短线交易逻辑。
- 中长期核心:拉长周期看,越靠近产业链上游的环节,其产业逻辑越硬。因为需求爆发的趋势是确定的,而上游的供给瓶颈最突出、格局最好,涨价的能力和持续性最强。因此,在仓位配置上,应更侧重上游(芯片、存储、先进封装等),下游环节的仓位可相对较轻。
-
循环往复:整个算力通胀可能不是单波次的。当下一轮强大的AI应用(例如世界模型、物理仿真)再次驱动Token消耗量出现新的指数级增长信号时,市场可能会重新认识到总量逻辑,从而再次启动从GPU等最上游开始的新一轮行情。

作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。

合规声明:本站发布的所有文章及观点均系个人研究共享,投资心得交流,不代表本站立场,且不构成任何形式的投资建议。投资者据此操作,风险自担,请务必保持独立审慎的决策态度。