从Token到“词元” 中国重新定义AI价值基石



(北京25日讯)在人工智能(AI)如火如荼发展的当下,一个长期困扰学术界与产业界的术语翻译争议终于尘埃落定。
中国国家数据局局长刘烈宏日前宣布,正式将“Token”翻译为中文“词元”,为智能时代确立了统一的“度量衡”。
ADVERTISEMENT
刘烈宏在2026年中国发展高层论坛上指出,“词元”不仅是智能时代的价值锚点,更是连接技术供给与商业需求的“结算单位”。这一译名的确定,为AI商业模式的落地提供了可量化的基础,让AI服务的交易像“用电量”一样清晰透明。
根据官方最新数据,中国在数据要素的建设上已取得突破性进展。截至2025年底,中国已建成超过10万个高质量数据集;而截至今年3月,中国日均词元调用量已飙升至140万亿次。
这一数字背后的增长速度令人震惊:与2024年初的1000亿次相比,增长超过了1000倍;即便与2025年底相比,短短三个月内也实现了40%以上的爆发式增长。
刘烈宏表示,数据集供给的增加正推动AI创新进入“量质齐升”的良性循环。
对于普通民众而言,“词元”可以被理解为AI处理信息的“数字化碎块”。无论是用户向手机发送一条指令,还是AI生成一段复杂的代码,背后都会被拆解成无数个“词元”进行计算。
因此,“词元调用量”就像是一个国家的“用电量”指标。调用量越高,意味着AI模型越活跃,反映出社会生产力正在经历数字化的深度变革。
以近期风靡市场的AI应用“龙虾”为例,其在执行复杂任务时,对词元的消耗量是普通对话模型的数十倍甚至百倍。
这种现象表明,中国人工智能的应用场景正从简单的“你问我答”转向能够独立决策、执行任务的“智能体”或AI代理(AI Agent)。
ADVERTISEMENT
热门新闻
百格视频
ADVERTISEMENT


