事件1:算力租赁行业涨价潮持续发酵,英伟达高端GPU租赁价格较上月再涨15%-30%,成为开年以来涨幅最集中的时段。H200时租涨至7.5-8.0元,月租金达6.0-6.6万元,涨幅高达25%-30%,订单排期已到2027年第二季度;H100月租金涨至5.5-6.0万元,涨幅15%-20%。事件2:中国模型API调用首超美国。OpenRouter数据显示:2月9~15日当周中国模型以4.12万亿Token的调用量首超美国模型的2.94万亿。MiniMax M2.5、Kimi K2.5、GLM-5、DeepSeek V3.2贡献Top5调用量85.7%。中国模型凭借MoE架构实现了极致的成本竞争力和商业化。大厂算力告急、需求缺口凸显。大厂对C端入口的争夺激烈,直接驱动并发请求与token消耗激增,算力的硬刚需凸显。字节旗下AI视频模型Seedance2.0算力已告急,高级会员排队人数破10万,等待时间长达5-10小时。国产芯片供给能力有望大幅增长。国内晶圆厂商积极进行技术升级与产能扩充:26年1月,晶合集成总投资355亿元的四期项目启动建设,预计2028年二季度达满产;26年1月,中芯国际通过置换股权,使国家集成电路基金持有其H股比例大增,中芯北方也将成为其全资子公司;25年12月,华虹公司官宣82亿元重磅收购,全控华力微并提升产能。超节点推动国产算力系统性机会。根据华为规划,昇腾950PR/950DT分别于26Q1/Q4推出,且将在已推出的Atlas 900 A3 SuperPoD(CoudMatrix 384超节点)基础上,后续推出Atlas 950 SuperPoD,支持8192张昇腾卡,超节点有望成为AI基建新常态。我们认为中国模型API信息处理量已经是美国的1.9倍,意味着API推理算力消耗强度已全球第一。国内大模型亦在积极适配国产算力生态,国产算力需求引擎“点燃”。一句话先讲透:我们不是靠高端卡堆算力赢的,是靠「极致成本+MoE架构+电力优势+出海爆发+工程效率」,把每一块算力用到极致,让全球开发者用脚投票。一、先看数据(OpenRouter,2026-02-16~22)中国模型:5.16万亿Token/周(三周涨127%)1️⃣ 价格碾压:成本差16~23倍,开发者直接换中国(MiniMax/GLM-5):输入**$0.3/百万Token**,输出**$1~2.5/百万Token**美国(Claude Opus):输入**$5/百万Token**,输出**$25/百万Token**差16~23倍!海外开发者、Agent、企业直接切换,Token量瞬间爆增我们大规模用MoE(混合专家):大模型拆成多个专家,只激活少数相关专家干活效果:显存占用↓60%,吞吐量↑19倍,同样硬件跑出N倍Token美国大厂仍以稠密模型为主,算力利用率低、成本下不来西部绿电0.2元/度,是欧美1/3;东数西算+统一大电网,算力+电力完美匹配电力+算力占Token成本70%+,我们直接把能源优势变成定价权中国厂商打通模型+云+芯片,软硬件深度适配,算力利用率拉满美国厂商多是模型公司,依赖第三方云与芯片,适配差、成本高海外AI应用、Agent、多模态需求井喷,中国模型性能对标、价格极低中国厂商周级迭代,长上下文、多Agent、多模态快速落地,精准切中痛点开源生态(如通义千问)降低门槛,形成全球开发者闭环推理对单卡性能要求更低,国产芯片+优化+规模化,足够支撑海量推理我们不是算力总量超过美国,而是「单位算力产出Token的效率+成本」全面领先。用MoE+低价电力+全栈优化,把每一块算力的价值放大10~20倍,再靠极致价格引爆全球需求,Token自然反超。作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。