2026年初,一群程序员在GitHub上“养”了一只AI龙虾(OpenClaw),它能自动写周报、回邮件、点外卖。全网都在模仿,圈内把它叫做“电子宠物元年”。
但不出三个月,龙虾就过气了。圈内的新顶流,是一匹马——Hermes Agent,名字碰瓷爱马仕,国内开发者直接叫它“马”。
这匹马有记忆、会进化、能跨应用执行复杂任务。让它写一份行业分析,它能自己查资料、做图表、标引用,全程不用人管。让它管理你的日程,它会自动协调会议、预订餐厅、同步提醒,像一个真正的助理。
上线不到60天,这匹马的GitHub星标突破三万,日均Token消耗从20亿激增到近3000亿,直接把OpenRouter的算力榜烧到第二名。
从龙虾到马,表面上是玩具在升级。藏在下面的那条曲线,才是真正的核弹——智能体对算力的消耗,正在以平方级的速度往上跳。
中信证券4月16日的研报给出了一组震撼数据:OpenRouter平台4月每周Token消耗量,比一年前暴涨了7到8倍,国产大模型贡献其中约四成。中国单日Token消耗量已经突破140万亿。传统AI对话一次只需几千Token,而智能体单次调用消耗的Token,是这个数字的10倍、100倍、甚至1000倍。
翻译成大白话:你点一次外卖,背后几百个智能体在同时跑;你做一份研报,几十万Token瞬间蒸发。而这种事,正在几亿人的手机上同时发生。
Token通胀,来了。
最先感受到滚烫的,是算力租赁市场。
英伟达H100的一年期租约,从2025年10月的1.70美元/小时飙到2026年3月的2.35美元/小时,涨幅近40%。更猛的是Blackwell B200,单GPU时租在3月突破5.47美元,环比暴涨23.5%。按需GPU全线售罄——不是涨价,是根本租不到。
Gartner在最新的预测里,直接给出了一个方向性的拐点:2026年,全球AI推理基础设施的资本支出将首次超过训练。到2029年,推理投入将达到720亿美元,是训练投入370亿美元的近两倍。
买铲子的人已经在疯狂囤货,而挖金子的人还在挤破头进场。
今年1月,英伟达与制药巨头礼来联合宣布,五年投入最高10亿美元共建AI实验室,专攻药物研发。阿斯利康紧随其后,首次收购AI制药公司Modella AI。默克更猛,未来五年直接砸超10亿美元用于AI基础设施。
制药,是AI推理算力最性感的增量场景。万亿赛道,刚需高频,几乎不容失败。而这些巨头的每一分钱算力预算,最终都会变成芯片公司、服务器公司、算力租赁公司的营收。
回到A股,产业链的传导已经清晰到可以直接列出来——
第一层:AI芯片(最直接受益)
· 海光信息(688041):2025年营收143.77亿,同比+57%。2026年Q1营收40.34亿,同比+68%。连续五个季度营收加速增长。公司自己都说,研发投入同比增超58%——敢这么砸钱,是因为订单已经看得见了。
· 寒武纪(688256):2025年营收64.97亿,同比暴增453%。存货翻倍至49.4亿,备货逻辑清晰——下游大客户在排产,库存要提前备足。广发证券预测2026年营收145亿,华泰预测净利润49亿(注:机构预测,非已实现业绩)。
第二层:服务器整机(订单已排到2027年)
· 浪潮信息(000977):全球AI服务器市占率46.6%,国内超50%。在手订单超350亿,合同负债315亿,同比暴增179%。排产已到2027年Q2。同时兼容英伟达和国产芯片,无论谁赢,它都赚。
· 拓维信息(002261):华为昇腾生态核心伙伴,AI服务器市占率超40%。公司已中标80亿元的智算中心大单,交付排期至2027年。2025年扭亏为盈,2026年Q1营收预期大幅增长。
· 高新发展(华鲲振宇):昇腾服务器出货量第一(据公司官方表述)。华鲲振宇直接参与了望石智慧AI药研联合解决方案的发布,从通用算力渗透到了垂直行业。
第三层:算力租赁(需求爆炸,上架率拉满)
· 润泽科技(300442):深度绑定字节跳动,2025年新增交付约220MW算力中心,上架率接近饱和。2026年3月中标香港沙岭5.81亿港元项目,达产后提供180EFLOPS算力。公司明确表示:AIDC收入将全面超越传统IDC。
· 奥飞数据:若羽臣在互动平台确认,已与奥飞数据合作完成基于DeepSeek的本地化算力集群落地。这是目前上市公司中唯一“实锤”的DeepSeek算力合作方。
第四层:AI4S平台(国家队入场)
· 中科曙光(603019):2026年4月,承建的6万卡AI4S计算集群在郑州投用,国内最大。公司拟发行80亿可转债,全部用于算力集群和AI服务器。客户是国家实验室和顶级高校,订单稳定且不受商业周期影响。
第五层:AI制药应用(远期弹性最大)
· 中国AI制药市场2024年规模5.6亿,2025年突破6亿。国内融资总额超67亿,同比+130%。但多数企业仍在亏损。全球市场2026年预计29.9亿美元。距离大规模盈利,仍有一段路要走。
产业链的利润分配顺序异常清晰:芯片和服务器先吃肉(订单已兑现)→ 算力租赁和AI4S平台接着喝汤(上架率加速、集群落地)→ AI制药等应用层最后分羹(业绩兑现需时间)。
Gartner帮我们把时钟调到了2026年——这一年,推理算力支出首次超过训练。这意味着,从“养龙虾”到“养马”,从对话机器人到智能体,从实验室到制药工厂,AI正在从“训练时代”进入“推理时代”。
Token通胀的故事,才刚刚翻开第一章。
风险提示:本文仅为产业逻辑梳理,不构成任何投资建议。市场有风险,投资需谨慎。文中涉及机构预测数据均为公开研报引用,不代表已实现业绩。浪潮信息合同负债数据来自2025年三季报,时效性需注意。拓维信息“80亿大单”为公司中标公告口径,奥飞数据合作信息来自若羽臣互动平台确认。
作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。