国产大模型进入算力换效果阶段，Token消耗指数级提升

2026-02-24 08:46:268℃

主要互联网大厂AI Agent春节核心表现梳理

阿里千问

春节主要活动：2026.2.2千问宣布30亿春节请客，2.6开启第一波活动，2.7宣布可以买盒马，2.10接入大麦，2.17起为所有人带来「每日首单立减」活动

春节活动效果：①「千问请客」春节活动期间（2.6-2.17），有超过1.3亿人在千问点奶茶、囤年货、买电影票/门票、订机酒；一共说了50亿次“千问帮我”。②“春节30亿大免单”上线6天（2.6-2.12），千问帮大家完成下单1.2亿笔。③据QM数据显示，2026.2.7原生千问应用DAU冲高到7352万

大模型更新：2026.2.16千问已接入最新Qwen3.5-Plus（2月16日重磅发布，模型总参数为3970亿、激活仅170亿、每百万Token仅0.8元）

字节豆包

春节主要活动：2025.12.28火山引擎正式成为总台春晚独家AI云合作伙伴，除夕当晚豆包通过总台春晚送出超10万份科技好礼以及最高8888元现金红包

春节活动效果：①2.16号除夕AI总互动19亿次，豆包过年活动帮用户生成超5000万张新春头像，#豆包大模型TPM（每分钟Token数）最高633亿。②据QM数据，2026.2.7#原生豆包应用DAU为7871万

大模型更新：2026.2.14已接入豆包大模型2.0Pro （多模态理解能力全面升级，多数基准达SOTA水平；LLM和Agent表现大幅强化，长程任务执行能力提升）

腾讯元宝

春节主要活动：2026.1.25元宝预告2月1日开启10亿现金红包春节活动，2.4开启首轮现金红包提现日，2.10-2.23在元宝创建派、@元宝互动等有机会抽红包

春节活动效果：①在主会场累计抽奖超36亿次，完成了超10亿次AI创作；21天内元宝更新迭代了159个功能。②据公司披露，春节活动期间（2.1-2.18）元宝多端DAU突破5000万、MAU达到1.14亿

大模型更新：2026.2.10腾讯混元发布面向消费级硬件的极小规模模型HY-1.8B-2Bit（模型参数量仅0.3B、内存占用约600MB）

核心结论：

- 国产AI大模型性能并未掉队，仍紧紧追赶国外顶尖大模型，推理性价比高；

- 国产AI通用大模型采用DSA稀疏注意力机制、异步调度策略、原生Agent RL等架构创新，提高Agent推理效率，显著提升Agent性能与实际使用体验；

- 国产AI大模型开启国产算力生态原生适配，GLM-5全面兼容七大主流国产芯片平台，国产算力芯片与国产AI大模型共振，需求加速增长；

- 看好AI硬件持续加速，GPU+CPU+CPO+OCS+内存，相关标的寒武纪、海光信息、芯原股份、华丰科技、英特尔、澜起科技。

国产算力：算力紧缺+主流大模型适配国产芯片印证算力需求旺盛

1）豆包：除夕AI互动19亿次，Seedance2．0为春晚提供技术支持；2）豆包App暂停视频通话功能；3）反超千问、蚂蚁阿福，豆包App Store排名第一；4）2月12日凌晨，智谱发布新一代旗舰模型 GLM-5。5）Meta加码英伟达，未来数年部署数百万颗芯片，首次采用Grace CPU。

春节流量峰值验证算力瓶颈，国产算力迎来规模化商用拐点。2026 年春节期间 AI 应用场景的集中爆发，直接凸显出算力资源的供给缺口，国内 AI 产业对算力的刚性需求进一步释放。1）字节跳动旗下豆包 App 因新春用户流量大幅攀升出现算力承压，于 2 月 16 日暂停视频通话功能，成为算力资源短期紧张的直接体现；2）作为 2026 年总台春晚独家 AI 云合作伙伴，豆包在除夕承接了大规模并发请求，当日 AI 互动总数达 19 亿，其大模型在春晚互动峰值时段的推理吞吐量更是达到 633 亿 tokens / 分钟，超大规模的算力调用直观反映出 AI 大模型落地过程中对算力基础设施的核心需求。3）春节期间国内头部科技企业围绕 AI 应用展开激烈的 C 端流量争夺，腾讯、阿里等厂商均加大资源投入布局 AI 应用，头部大模型厂商对 C 端流量入口的加速抢占，将推动 AI 大模型训练、推理等环节的算力需求持续攀升，算力资源的供需矛盾进一步加剧。4）大厂自研芯片或成为趋势，同时第三方芯片厂加速迭代GPU+CPU，赢家通吃稳固竞争地位；我们认为AI 应用规模化落地带来的算力需求增量，将加速国产算力硬件设备、算力服务运营、算力基础设施建设等全产业链环节发展。

主流大模型全面适配国产芯片。2026 年 2 月 12 日凌晨智谱新一代旗舰模型 GLM-5 重磅发布，成为国产大模型与国产算力硬件深度融合的重要里程碑。该模型已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光七大主流国产芯片平台的深度推理适配与算子级优化，成功实现在国产算力集群上高吞吐、低延迟的稳定运行，我们认为这标志着国产大模型与国产芯片的适配性迈上新台阶，从底层技术层面打通了国产算力链条的应用壁垒。

其他相关标的：

算力：海光信息、禾盛新材、寒武纪等；

存储：闪迪、美光、海力士、香农芯创；

上游：华正新材、呈和科技、宏和科技、延江股份、德福科技等；

服务器：中科曙光、浪潮信息、紫光股份；

云计算：首都在线、优刻得、青云科技；

其他：宏景科技、协创数据、数据港等。

GLM5技术解析：国产模型进入算力换效果阶段，Token消耗指数级提升！

【参数规模翻倍、Agentic能力大跃升】 GLM-5总参数量翻倍扩张至744B（激活参数40B），相比前代GLM-4.5的355B（激活参数32B）实现了大幅扩容。同时，GLM-5在各项核心基准测试平均提升约20%，综合实力比肩Claude Opus 4.5与GPT-5.2 。在SWE-bench Verified测试中得分达到77.8% ，BrowseComp得分75.9% 。

【DSA稀疏架构加持、国产卡高度适配】 GLM-5采用DSA稀疏注意力架构，在处理长序列时直接将GPU注意力算力成本降低了一半。此外，模型深度适配国产芯片生态，通过极致的W4A8量化策略，在单台节点即可媲美国际双GPU集群，并将长序列场景下的部署成本大幅削减50% 。

【“交替思考”模式、国产模型进入算力换效果阶段】 GLM5引入了 “交替思考”（Interleaved Thinking），在每次回复和调用工具前进行深度推理。正如我们在年度策略《两仪生四象，超级时代》中所强调，Interleaved Thinking会带来海量的长前缀预填充，从而带来算力的指数级提升

【VibeCoding向VibeAgent转变】 GLM-5致力于推动Al从被动的代码生成向自主规划、迭代的“Agentic Engineering”转变。在内部真实场景测试集CC-Bench-V2中展现了出色的端到端处理能力；综合参考Openrouter的Token调用看、我们认为：国产模型能力的下限从“抽卡”到“工业化可用”，达到了Coding、Agent稳定可用的要求，后续受益于Token放量+出海。

作者声明：本文转载自第三方，旨在提供资讯参考，并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日，作者与文中提及的标的不存在持仓关系。

标签: CPO 云计算互联网华为华为昇腾综合腾讯芯片英伟达阿里

合规声明：本站发布的所有文章及观点均系个人研究共享，投资心得交流，不代表本站立场，且不构成任何形式的投资建议。投资者据此操作，风险自担，请务必保持独立审慎的决策态度。

本文链接：https://www.sanhuba.cn/post/08-42-706.html

上一篇“电力不出境、算力价值跨境”新模式

国产大模型进入算力换效果阶段，Token消耗指数级提升

CPO相关

栏目分类

云计算相关

互联网相关

用户须知

国产大模型进入算力换效果阶段，Token消耗指数级提升

 CPO相关

 栏目分类

 云计算相关

 互联网相关

用户须知

CPO相关

栏目分类

云计算相关

互联网相关

用户须知