
词元概念获国家官方定名,开启
AI 商业化新纪元。
2026 年
3 月,国家数据局正式将
Token 定名为
“词元”,定义为
AI 大模型处理信息的最小语义单元,具备可计量、可定价、可交易的核心特征。我国日均词元调用量已突破
140 万亿,较
2024 年初的
1000 亿实现两年超千倍增长,标志着
AI 产业从技术探索进入规模化商业化阶段。
产业链投资价值凸显,三大主线构建万亿赛道。
词元经济产业链清晰,上游算力基础设施最稳健,中游调度优化弹性最大,下游应用消耗长期空间最广。中国企业在光模块领域占据全球
70% 份额,中际旭创、新易盛等龙头企业在
800G/1.6T 高端市场形成双寡头垄断格局。算力租赁需求爆发,润泽科技、中贝通信等企业订单饱满,智算中心上架率超
90%。
重点推荐四大投资主线:
光模块龙头(中际旭创、新易盛、天孚通信)、AI
芯片
/ 服务器(海光信息、寒武纪、浪潮信息)、算力租赁(润泽科技、中贝通信、鸿博股份)、大模型应用(科大讯飞)。建议重点关注技术壁垒高、市场份额领先、1
年期业绩增长确定性强的头部企业。
时代的最小信息单元与价值锚点1.1 官方定义与技术内涵
词元(Token)的官方定义清晰明确:它是人工智能大模型处理、理解和生成信息(尤其是文本)的最小基本单位。国家数据局首次明确词元是大模型处理信息的最小信息单元,具备可计量、可定价、可交易的核心特征。这一定义精准概括了词元作为
AI”最小思维积木”
的本质属性,为技术交流、产业统计、公众科普提供了统一标尺,避免了中英文混杂带来的认知壁垒。
从技术原理来看,词元化(Tokenization)是大模型预处理的核心步骤,将连续文本切分为模型可理解的最小语义单元,这些词元可以是单词、子词或字符。在实际应用中,词元的切分粒度介于
“字”
与
“词”
之间,可以是一个字、一个词、一个子词片段或一个标点符号。例如,“今天天气真好”
这句话可能被拆成「今天
/ 天气
/ 真
/ 好」4
个词元,而非简单的单字切分。
词元的技术重要性体现在其作为
AI 运行的
“数字燃料”。从
GPT 开启的生成式
AI 浪潮,到如今国产大模型的全面突破,其核心技术逻辑始终是
“预测下一个词元”——AI 的每一次对话、每一次内容生成,本质上都是基于海量数据,对下一个词元的概率预测与序列生成。这一核心逻辑在
2026 年初得到验证,北京智源人工智能研究院的
Emu3 模型凭借词元预测实现了统一文本、图像、视频多模态学习的重大突破,登上国际顶级期刊《Nature》。
词元的应用场景极其广泛,涵盖了
AI 技术的各个领域。在文本处理中,词元是语言理解和生成的基础;在多模态时代,通过统一的分词技术,图像、音频、视频乃至机器人动作信号,都可以被转化为离散的词元序列,让
AI 实现跨模态的统一学习与生成。每一次
AI 交互(对话、生成、分析、推理)都需消耗词元,其调用量直接反映
AI 算力的实际消耗与应用渗透度。
词元的商业化价值在于其
“可计量、可定价、可交易”
的属性。国家数据局明确将词元定位为智能时代的价值锚点和结算单位,为
AI 商业模式的落地提供了可量化的可能。这一属性解决了
AI 产业长期以来
“盈利模式模糊”
的痛点,按词元消耗量计费的模式正在成为
AI SaaS、API 服务的主流收费方式,为企业提供了可预测的现金流。
从市场规模来看,词元经济正在经历爆发式增长。2026
年
3 月,腾讯云宣布混元系列核心模型输入价格从
0.0008 元
/ 千词元上调至
0.004505 元
/ 千词元,涨幅高达
463.13%,标志着大模型行业正式进入以词元为核心标尺的商业化成熟期。随着
AI 应用从简单的对话聊天向能执行复杂任务的智能体(Agent)进化,词元的消耗规模出现了量级跃迁,一次普通的人机对话仅需消耗数百词元,而智能体在执行编程、数据分析、多工具调用等长链条任务时,词元消耗可达数百万级。
词元经济正在重构整个
AI 产业链的价值分配体系。产业链分为上游、中游、下游三大主线:上游是词元
“生产端”(最稳、最硬、最适合底仓),中游是词元
“调度
/ 优化
/ 降本”(弹性最大、波段最香),下游是词元
“应用
/ 消耗端”(长期空间最大)。
从价值分配来看,上游算力、硬件环节的价值大幅提升,不再是单纯的配套产业,而是词元经济的核心支柱。具体而言,第一梯队是算力基础设施与运营,被称为最稳的
“卖铲人”;第二梯队是大模型厂商,直接卖词元的
“金矿主”,其商业模式就是直接按词元的调用量收费;第三梯队是数据要素
+ 安全
+ 核心硬件,扮演产业链的
“粮草官”
和
“护卫队”
角色。
中国企业在这一产业链重构中占据重要地位。在光模块领域,中国大陆厂商凭借在磷化铟(InP)基板领域的全球产能优势,占据了全球光模块供应约
70% 的份额。在
2023 年全球光模块
TOP10 榜单中,中国厂商占据了七个席位,中际旭创首次登顶榜首。这种产业优势为中国企业在词元经济时代获得定价权奠定了基础。
股词元产业链全景分析

2.1 上游:算力基础设施与核心硬件
词元产业链上游主要包括算力基础设施、AI
芯片、服务器制造等核心硬件环节,这些企业是词元
“生产工厂”,在产业链中占据最稳健的地位。
算力基础设施领域,主要企业包括润泽科技、中贝通信、鸿博股份、优刻得、首都在线、光环新网、云赛智联、美利云、数据港等。其中,润泽科技作为字节智算核心,被称为
“词元算力工厂”;中贝通信提供算力调度
+ 词元推理全链条服务;鸿博股份绑定
MiniMax,被誉为
AI 智算中心的
“词元工厂”。这些企业手握大量算力资源,直接受益于词元经济的爆发,是产业链上游的核心环节。
AI 芯片与服务器制造领域,龙头企业包括浪潮信息、紫光股份、海光信息、寒武纪、工业富联等。浪潮信息是
AI 服务器龙头,国内
AI 服务器市占率连续多年第一,2025
年上半年稳定在
55%-60%,全球服务器市占率排名第二。海光信息是国产
CPU/GPU 龙头,DCU(算力芯片)市占率位居前列,国产
DCU 市场份额约
62%。寒武纪是纯
AI 芯片龙头,国内唯一云端
/ 边缘端全布局
AI 芯片企业,思元
590 芯片国产推理端份额第一。工业富联是全球
AI 服务器代工龙头,份额约
40%,深度绑定英伟达。
存储与配套硬件领域,包括澜起科技、兆易创新、江波龙、深科技、佰维存储等存储芯片
/ 设备企业,以及沪电股份、深南电路、英维克、高澜股份等
PCB 与散热企业。澜起科技在内存接口芯片领域全球市占率超
40%,DDR5
技术专利壁垒深厚;兆易创新是
Nor Flash 全球第三,自研
DDR5 产品加速放量,存储全链条布局强化竞争力。
中游环节以光模块为核心,承担词元
“高速通道”
功能,是产业链中技术壁垒最高、增长弹性最大的环节之一。
光模块领域呈现中国企业主导的竞争格局。中国企业占据全球光模块
70% 以上市场份额,在
800G/1.6T 高端领域优势进一步扩大,行业
CR5 超
75%,呈现
“强者恒强”
格局。主要企业包括中际旭创、新易盛、天孚通信、光迅科技、新易盛、天孚通信、源杰科技等。
中际旭创作为全球光模块绝对龙头,800G
光模块全球市占率超
40%,1.6T
产品已实现规模化量产。根据最新数据,中际旭创在
800G/1.6T 光模块市场分别保持
25%-30% 和
35%-40% 的全球份额。新易盛是高弹性成长标杆,LPO
技术全球领先,800G/1.6T
全球份额超
25%,LPO
技术市占率达
75%,是
Meta LPO 路线核心供应商。天孚通信是
CPO 光引擎全球垄断者,光引擎全球市占率超
60%,独家供应英伟达
GB200/Rubin 平台
70%-80% 的光引擎份额。
光器件配套领域,天孚通信作为光器件平台型公司,为高速光模块提供上游核心组件,是词元传输产业链的上游卖铲人,受益于光模块需求的全面爆发。天孚通信的
FAU(光纤阵列单元)全球市场占有率超过
50%,更是全球唯一大规模量产
D-FAU(可拆光纤阵列)的企业,在光纤阵列领域具有绝对龙头地位。
下游环节包括大模型厂商、数据语料供应商和应用服务商,是词元
“应用
/ 消耗端”,长期空间最大。
大模型厂商直接按词元调用量收费,是词元经济中最直接的受益者。主要企业包括科大讯飞、昆仑万维、三六零等。科大讯飞的星火大模型是中文龙头,2025
年大模型相关项目中标金额超
23 亿元,蝉联行业
“标王”。昆仑万维的天工大模型海外落地,三六零的
360 智脑在词元计量商业化方面积极探索。
数据语料供应商提供词元训练的核心原材料。主要企业包括中文在线、拓尔思、捷成股份等。中文在线拥有独家语料合作,是词元训练核心数据方;拓尔思提供垂直领域高质量数据;捷成股份拥有
AI 影视词元
+ 版权数据,与阶跃星辰成立联合实验室,是
AI 影视词元生成的核心数据与技术供给方。华策影视与
Step-Video 深度合作,拥有海量短剧、影视版权数据,在短剧
AI 生成的词元应用场景中占据领先地位。
算力租赁服务商提供词元计算的基础设施。国内布局算力租赁的代表性企业有数据港、润建股份等,这些企业手握大量算力资源,直接受益于词元经济的爆发。润泽科技、中贝通信、鸿博股份等企业不仅提供算力租赁服务,还具备算力调度
+ 词元推理全链条服务能力。

3.1 光模块龙头企业
中际旭创(300308):全球光模块绝对龙头
中际旭创是全球光模块行业的绝对领导者,在技术、市场份额、客户资源等方面均处于行业领先地位。公司在
800G 光模块市场占有率超
40%,1.6T
光模块市占率达
50%-70%,深度绑定英伟达、谷歌、微软、Meta
等全球
TOP 云厂商。
从财务表现来看,公司
2025 年实现营收
382.4 亿元,同比增长
60.25%;归母净利润
107.99 亿元,同比增长
108.81%,业绩实现翻倍增长。2026
年一季度业绩预告更为亮眼,净利润预增
184-216%,全年目标
200-260 亿元。公司订单排期至
2027 年上半年,产能利用率达
120% 超负荷运行。
核心优势:技术壁垒高,800G/1.6T
良率达
95%(行业平均
85%),硅光芯片良率
90%(行业
80%);成本控制能力强,每
100 万只
1.6T 模块,良率差距可节省
5000 万美元成本;全球
800G 模块
40% 产能,交货周期
30 天(同行
40-50 天);客户资源优质,深度绑定全球顶级云厂商。
主要风险:光模块行业技术迭代快,CPO、LPO
等新技术可能对传统可插拔光模块形成冲击;高端光芯片自给率低,仍依赖海外供应商,面临供应链风险;行业竞争加剧,新易盛等竞争对手在
LPO 技术上快速追赶。
新易盛(300502):LPO
技术全球领先的高弹性标的
新易盛是光模块行业的高弹性成长标杆,在
LPO(线性驱动光模块)技术领域全球领先。公司
800G/1.6T 全球份额超
25%,LPO
技术市占率达
75%,是
Meta LPO 路线的核心供应商。
公司在技术路线上实现了多元化布局,覆盖
ML 硅光、CPH
薄膜铌酸锂、TFN
TF 等多方案。在
800G LPO 产品上,功耗仅
9W(较传统降
30%),成本较硅光低
15%-20%,获得
Meta、AWS 等大客户批量订单。2025
年上半年,全球
800G 光模块出货量约
1800 万只,新易盛占比约
15%,市场份额稳居行业前列。
核心优势:LPO
技术全球领先,在功耗和成本方面具有显著优势;客户结构优质,深度绑定
Meta、亚马逊等海外顶级云厂商;技术路线多元化,具备较强的技术适应能力。
主要风险:在
1.6T 等高端产品上技术积累相对落后于中际旭创;对海外市场依赖度较高,面临地缘政治风险;行业竞争激烈,价格压力持续存在。
天孚通信(300394):CPO
光引擎全球垄断者
天孚通信是光模块产业链上游的关键供应商,在
CPO(共封装光学)光引擎领域具有垄断地位。公司光引擎全球市占率超
60%,独家供应英伟达
GB200/Rubin 平台
70%-80% 的光引擎份额,1.6T
光引擎已规模化量产。
公司卡在
“光引擎
+ FAU+ELS” 这些价值最高、门槛最高、对技术路线最不敏感的位置,成为
AI 光互联产业链中
“卖铲子、掐命门”
的关键企业。在
FAU(光纤阵列单元)领域,公司全球市场占有率超过
50%,是全球唯一大规模量产
D-FAU(可拆光纤阵列)的企业。
核心优势:技术壁垒极高,在
CPO 光引擎领域具有垄断地位;客户粘性强,独家供应英伟达核心平台;产品毛利率高,盈利稳定性强;资产负债率最低,财务结构健康。

海光信息(688041):国产
CPU/GPU 双轮驱动
海光信息是国产
CPU/GPU 龙头企业,在信创和
AI 算力领域具有重要地位。公司
2025 年实现营收
143.76 亿元,同比增长
56.91%;归母净利润
25.42 亿元,同比增长
31.66%。2026 年一季度业绩预告显示,营收预计
39.1-42.2 亿元,同比增长
62.91%-75.82%;归母净利润
6.2-7.2 亿元,同比增长
22.56%-42.32%。
公司在技术实力方面表现突出,DCU(算力芯片)市占率位居前列,国产
DCU 市场份额约
62%。2025 年
DCU 销量达
28 万张,同比激增
210%,国产训练卡市占率超
30%。公司在服务器芯片领域的技术优势与市场份额持续提升,2025
年独家中标中国工商银行约
30 亿元的海光服务器订单。
核心优势:CPU+DCU
双产品布局,技术路线多元化;国产替代空间巨大,受益于信创政策推动;研发投入占比高,技术创新能力强;客户资源优质,在金融、电信等关键行业渗透率高。
寒武纪(688256):纯
AI 芯片龙头的业绩爆发
寒武纪是国内唯一云端
/ 边缘端全布局的
AI 芯片企业,2025
年实现了历史性突破。公司全年营收
64.97 亿元,同比增长
453.21%;归母净利润
20.59 亿元,同比增长
555.24%,实现上市后首次年度盈利。
公司的核心产品思元
590 芯片在国产推理端份额第一,云端产品线营收
64.77 亿元,毛利率高达
55.22%。2025 年智能芯片及板卡销量
11.74 万片,同比增长
201.57%,产能和市场需求均实现爆发式增长。
核心优势:技术壁垒高,是全球少数全自研
AI 芯片架构企业;产品性能领先,思元
590/370 系列针对大模型训推底层优化;研发投入占比约
18.3%,技术创新能力强;在国产
AI 芯片领域具有先发优势。
浪潮信息(000977):全球
AI 服务器龙头的规模困境
浪潮信息是全球
AI 服务器龙头企业,国内
AI 服务器市占率连续多年第一,2025
年上半年稳定在
55%-60%,全球服务器市占率排名第二。在
Gartner 的报告中,浪潮信息凭借
11.3% 的全球市占率稳居第一梯队,2024
年公司实现营业收入
1147.67 亿元,同比增长
74.24%。
然而,公司的盈利能力却呈现出
“增收不增利”
的困境。2025
年前三季度,公司实现营收
1206.69 亿元,同比增长
44.85%,但归母净利润仅
14.82 亿元,同比增长
15.35%;毛利率仅为
4.91%,净利率仅
1.23%。
核心优势:规模优势明显,全球
AI 服务器市占率超
30%;客户资源优质,深度绑定互联网大厂和政企客户;液冷技术领先,拥有
800 + 专利;全栈生态完善,与
600 + 算法商合作。
润泽科技(300442):字节系算力运营龙头
润泽科技是国内领先的第三方数据中心服务商,深度绑定字节跳动等头部
AI 厂商,是
A 股最正宗的词元概念标的之一。公司
2025 年实现营收
51.6 亿元,同比增长
68.8%;归母净利润
23.8 亿元,同比增长
178.4%,盈利能力大幅提升。
公司的核心优势在于与头部
AI 企业的深度绑定关系。润泽科技与字节跳动签订
50 亿长单,是字节智算核心供应商,收入占比超
60%。公司在液冷技术方面处于行业领先地位,全栈液冷技术(冷板式
/ 浸没式)适配
AI 高密机柜(60kW+),PUE
低至
1.1。智算中心上架率超
90%,算力租赁收入占比极高。
核心优势:客户资源优质,深度绑定字节跳动等头部
AI 企业;技术领先,液冷技术
PUE<1.1,适配高密度
AI 芯片;单机柜功率
40kW+,纯液冷技术,单位算力产出词元效率行业领先;在手订单充足,业绩增长确定性强。
中贝通信(603220):算力调度全链条服务商
中贝通信是一家正在向算力服务转型的通信企业,提供算力调度
+ 词元推理全链条服务。公司已投产约
1.8 万
P 算力,规划超
1.1 万
P,采用英伟达
+ 华为昇腾双路线布局。
然而,公司的转型之路面临诸多挑战。2025
年三季报显示,公司归属净利润同比大幅下滑
41.14%,主要受传统
5G 业务毛利减少及财务费用增加拖累。公司资产负债率高达
72.68%,流动比率与速动比率均低于
1,显示出一定的短期偿债压力。
核心优势:算力规模较大,已投产
1.8 万
P,规划超
1.1 万
P;技术路线多元化,英伟达
+ 华为昇腾双路线布局;政企订单充足,在政府和企业市场具有一定优势;2025
年算力租赁营收占比
35%,同比增
250%,增长势头良好。
鸿博股份(002229):MiniMax
算力供应商
鸿博股份通过与
MiniMax 的深度合作,成为
AI 智算中心的
“词元工厂”。北京
AI 创新中心已落地超
4000P 算力,与英伟达深度绑定,具备稀缺的高端
GPU 算力资源,出租率处于高位。
公司
2025 年第一季度实现营收
6.77 亿元,同比增长
337.25%;归母净利润
8458 万元,上年同期亏损
2506 万元,实现扭亏为盈。北京京能项目一期
1024PFLOPS 算力设备交付验收,合同金额调整至
6.46 亿元,已收前两笔款项
8 亿元。
核心优势:与
MiniMax 深度绑定,在算力供应方面具有不可替代性;拥有稀缺的高端
GPU 算力资源,H100/A100/H200
集群配置;北京
AI 创新中心已落地超
4000P 算力,规模优势明显;MiniMax
上市后算力需求有望持续释放。
科大讯飞(002230):中文大模型龙头的商业化困境
科大讯飞是国内人工智能龙头企业,星火大模型在中文自然语言处理领域具有领先地位。公司
2025 年大模型相关项目中标金额超
23 亿元,蝉联行业
“标王”,中标数量和金额均居行业第一,超过第二名至第六名的总和。
2026 年开年以来,公司订单持续放量,开年
10 天内中标
12 个项目,总金额超
6 亿元;郑州航空港
AI 赋能中心项目单笔
14.39 亿元;2026
年整体
AI 新增订单预计超
80 亿元。公司在教育、医疗等垂直领域具有深厚积累,2026
年
1-2 月中标额达
22.5 亿元,同比增长
288%。
核心优势:在中文语音和自然语言处理领域具有深厚技术积累;全栈国产化能力,在涉及国计民生的核心项目中具有数据安全优势;垂直行业应用成熟,教育
+ 医疗占比超
60%;政企订单增长迅速,同比增长
70%;品牌认知度高,在
C 端市场具有一定影响力。
基于对词元产业链的深入分析,我们建议投资者重点关注以下四大投资主线:
第一主线:光模块龙头企业。推荐中际旭创(全球市占率第一,技术壁垒高,订单饱满)、新易盛(LPO
技术领先,弹性大)、天孚通信(CPO
光引擎垄断地位,财务稳健)。光模块是
AI 算力需求爆发的最直接受益者,中国企业在全球市场占据主导地位,技术迭代快但龙头企业优势明显。
第二主线:AI
芯片与服务器。推荐海光信息(CPU+DCU
双轮驱动,国产替代空间大)、寒武纪(纯
AI 芯片龙头,业绩爆发式增长)。虽然浪潮信息规模领先,但盈利能力过弱,建议谨慎关注。AI
芯片是算力基础设施的核心,国产替代是长期趋势。
第三主线:算力租赁企业。推荐润泽科技(深度绑定字节跳动,液冷技术领先)。中贝通信和鸿博股份虽然有一定成长性,但财务风险较大,建议选择性关注。算力租赁直接受益于词元调用量增长,但需注意客户集中度和财务风险。
4.2 投资策略建议
配置策略:建议采用
“核心
+ 卫星”
的配置策略,核心仓位配置光模块龙头(中际旭创、天孚通信)和
AI 芯片龙头(海光信息),这些企业具有较强的确定性和成长性;卫星仓位可配置算力租赁(润泽科技)和高弹性标的(新易盛、寒武纪)。
估值策略:当前部分龙头企业估值已处于历史高位,建议采用分批建仓策略,在市场调整时逐步买入。重点关注
PEG 指标,优选业绩增长确定性高、估值相对合理的标的。
风险控制:密切关注技术迭代风险,特别是
CPO、LPO 等新技术对传统光模块的冲击;关注供应链风险,特别是高端芯片和光芯片的供应安全;关注客户集中度风险,避免过度依赖单一大客户的企业;关注财务风险,重点监控高负债率和现金流恶化的企业。
技术迭代风险:AI
技术发展日新月异,词元相关技术可能面临快速迭代,现有技术路线可能被颠覆。光模块行业技术迭代周期已缩短至
1-2 年,CPO、LPO
等新技术可能对传统产品形成冲击。
供应链风险:高端光芯片、GPU
等核心器件对外依存度较高,面临国际贸易政策变化和供应链中断的风险。特别是在地缘政治紧张的背景下,关键零部件的供应安全面临挑战。
市场竞争风险:随着词元经济的发展,越来越多的企业进入相关领域,市场竞争可能加剧。特别是在技术壁垒相对较低的环节,可能出现价格战,压缩利润空间。
政策监管风险:AI
产业发展受到政策监管的影响,数据安全、算法公平等方面的监管政策可能对行业发展产生影响。
估值泡沫风险:部分龙头企业估值已处于历史高位,存在估值泡沫风险。特别是在市场情绪过热的情况下,股价可能出现大幅调整。
需求波动风险:AI
应用的普及速度可能低于预期,词元调用量增长可能出现波动,影响相关企业的业绩表现。
投资者应充分认识词元概念相关投资的风险,根据自身风险承受能力谨慎投资,避免盲目追高。建议重点关注具有核心技术壁垒、市场地位稳固、财务状况健康的龙头企业,长期持有,分享
AI 时代的发展红利。
作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。