春节主要活动:2026.2.2千问宣布30亿春节请客,2.6开启第一波活动,2.7宣布可以买盒马,2.10接入大麦,2.17起为所有人带来「每日首单立减」活动春节活动效果:①「千问请客」春节活动期间(2.6-2.17),有超过1.3亿人在千问点奶茶、囤年货、买电影票/门票、订机酒;一共说了50亿次“千问帮我”。②“春节30亿大免单”上线6天(2.6-2.12),千问帮大家完成下单1.2亿笔。③据QM数据显示,2026.2.7原生千问应用DAU冲高到7352万大模型更新:2026.2.16千问已接入最新Qwen3.5-Plus(2月16日重磅发布,模型总参数为3970亿、激活仅170亿、每百万Token仅0.8元)春节主要活动:2025.12.28火山引擎正式成为总台春晚独家AI云合作伙伴,除夕当晚豆包通过总台春晚送出超10万份科技好礼以及最高8888元现金红包春节活动效果:①2.16号除夕AI总互动19亿次,豆包过年活动帮用户生成超5000万张新春头像,#豆包大模型TPM(每分钟Token数)最高633亿。②据QM数据,2026.2.7#原生豆包应用DAU为7871万大模型更新:2026.2.14已接入豆包大模型2.0Pro (多模态理解能力全面升级,多数基准达SOTA水平;LLM和Agent表现大幅强化,长程任务执行能力提升)春节主要活动:2026.1.25元宝预告2月1日开启10亿现金红包春节活动,2.4开启首轮现金红包提现日,2.10-2.23在元宝创建派、@元宝互动等有机会抽红包春节活动效果:①在主会场累计抽奖超36亿次,完成了超10亿次AI创作;21天内元宝更新迭代了159个功能。②据公司披露,春节活动期间(2.1-2.18)元宝多端DAU突破5000万、MAU达到1.14亿大模型更新:2026.2.10腾讯混元发布面向消费级硬件的极小规模模型HY-1.8B-2Bit(模型参数量仅0.3B、内存占用约600MB)核心结论:
- 国产AI大模型性能并未掉队,仍紧紧追赶国外顶尖大模型,推理性价比高;
- 国产AI通用大模型采用DSA稀疏注意力机制、异步调度策略、原生Agent RL等架构创新,提高Agent推理效率,显著提升Agent性能与实际使用体验;
- 国产AI大模型开启国产算力生态原生适配,GLM-5全面兼容七大主流国产芯片平台,国产算力芯片与国产AI大模型共振,需求加速增长;
- 看好AI硬件持续加速,GPU+CPU+CPO+OCS+内存,相关标的寒武纪、海光信息、芯原股份、华丰科技、英特尔、澜起科技。
国产算力:算力紧缺+主流大模型适配国产芯片印证算力需求旺盛1)豆包:除夕AI互动19亿次,Seedance2.0为春晚提供技术支持;2)豆包App暂停视频通话功能;3)反超千问、蚂蚁阿福,豆包App Store排名第一;4)2月12日凌晨,智谱发布新一代旗舰模型 GLM-5。5)Meta加码英伟达,未来数年部署数百万颗芯片,首次采用Grace CPU。春节流量峰值验证算力瓶颈,国产算力迎来规模化商用拐点。2026 年春节期间 AI 应用场景的集中爆发,直接凸显出算力资源的供给缺口,国内 AI 产业对算力的刚性需求进一步释放。1)字节跳动旗下豆包 App 因新春用户流量大幅攀升出现算力承压,于 2 月 16 日暂停视频通话功能,成为算力资源短期紧张的直接体现;2)作为 2026 年总台春晚独家 AI 云合作伙伴,豆包在除夕承接了大规模并发请求,当日 AI 互动总数达 19 亿,其大模型在春晚互动峰值时段的推理吞吐量更是达到 633 亿 tokens / 分钟,超大规模的算力调用直观反映出 AI 大模型落地过程中对算力基础设施的核心需求。3)春节期间国内头部科技企业围绕 AI 应用展开激烈的 C 端流量争夺,腾讯、阿里等厂商均加大资源投入布局 AI 应用,头部大模型厂商对 C 端流量入口的加速抢占,将推动 AI 大模型训练、推理等环节的算力需求持续攀升,算力资源的供需矛盾进一步加剧。4)大厂自研芯片或成为趋势,同时第三方芯片厂加速迭代GPU+CPU,赢家通吃稳固竞争地位;我们认为AI 应用规模化落地带来的算力需求增量,将加速国产算力硬件设备、算力服务运营、算力基础设施建设等全产业链环节发展。主流大模型全面适配国产芯片。2026 年 2 月 12 日凌晨智谱新一代旗舰模型 GLM-5 重磅发布,成为国产大模型与国产算力硬件深度融合的重要里程碑。该模型已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光七大主流国产芯片平台的深度推理适配与算子级优化,成功实现在国产算力集群上高吞吐、低延迟的稳定运行,我们认为这标志着国产大模型与国产芯片的适配性迈上新台阶,从底层技术层面打通了国产算力链条的应用壁垒。GLM5技术解析:国产模型进入算力换效果阶段,Token消耗指数级提升!【参数规模翻倍、Agentic能力大跃升】 GLM-5总参数量翻倍扩张至744B(激活参数40B),相比前代GLM-4.5的355B(激活参数32B)实现了大幅扩容 。同时,GLM-5在各项核心基准测试平均提升约20%,综合实力比肩Claude Opus 4.5与GPT-5.2 。在SWE-bench Verified测试中得分达到77.8% ,BrowseComp得分75.9% 。【DSA稀疏架构加持、国产卡高度适配】 GLM-5采用DSA稀疏注意力架构,在处理长序列时直接将GPU注意力算力成本降低了一半 。此外,模型深度适配国产芯片生态 ,通过极致的W4A8量化策略 ,在单台节点即可媲美国际双GPU集群,并将长序列场景下的部署成本大幅削减50% 。【“交替思考”模式、国产模型进入算力换效果阶段】 GLM5引入了 “交替思考”(Interleaved Thinking),在每次回复和调用工具前进行深度推理。正如我们在年度策略《两仪生四象,超级时代》中所强调,Interleaved Thinking会带来海量的长前缀预填充,从而带来算力的指数级提升【VibeCoding向VibeAgent转变】 GLM-5致力于推动Al从被动的代码生成向自主规划、迭代的“Agentic Engineering”转变 。在内部真实场景测试集CC-Bench-V2中展现了出色的端到端处理能力;综合参考Openrouter的Token调用看、我们认为:国产模型能力的下限从“抽卡”到“工业化可用”,达到了Coding、Agent稳定可用的要求,后续受益于Token放量+出海。作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。