
图片来源于网络,如有侵权,请联系删除
近来,“词元”(Token)在互联网上频频“出圈”,对“词元经济”的讨论热度也持续不减。日前发布的《全国数据资源调查报告(2025年)》显示,2025年全国年度数据生产总量达52.26泽字节(ZB),全球占比超27%;词元调用量约21100万亿,呈指数级增长。
所谓词元,是人工智能大模型处理信息的基本单元。它可以是单个汉字、标点符号,或一个词语片段。我们每次向人工智能大模型提问,以及大模型生成的文字、图片或视频等,都离不开词元的调用和运算。而词元经济,则是指在人工智能领域,围绕词元的生产、调用、分发与结算所衍生形成的新型经济形态。

图片来源于网络,如有侵权,请联系删除
可以说,词元正成为人工智能产业发展的“晴雨表”。词元调用量的不断攀升,充分彰显了我国人工智能产业欣欣向荣的发展态势。“养龙虾”全网爆火,让人们切身感受到人工智能不仅会“聊天”,还能“干活”;DeepSeek-V4预览版本正式上线并同步开源,关键性能指标达到国内外领先水平;豆包大模型披露付费计划,尝试在免费版的基础上,推出包含更多增值服务的付费版本,打开国产大模型“价值变现”的商业化想象空间……
当前,我国词元经济发展方兴未艾,但也面临诸多挑战。比如,在高端制造、金融投资等对精度和可靠性要求严苛的专业领域,从词元数据质量到模型推理过程,国产人工智能大模型的表现还“欠些火候”;“数据孤岛”现象依然存在,公共数据开发利用处于起步阶段,高质量数据集短缺,数据要素流通仍需“拆墙铺路”;利用人工智能大模型生成虚假信息、侵犯版权及肖像权等乱象层出不穷,亟须监管为其“套上缰绳”;人工智能大模型的商业模式尚在探索,清晰且可持续的“生意经”仍待市场验证。
充分激发词元经济活力,关键在于找准制约词元价值释放的瓶颈所在,精准发力、协同推进,构建起良好的词元经济生态。例如,突破核心算法等方面的技术短板,助力国产大模型在更多实际应用场景中“落地生根”;打破“数据孤岛”,让数据要素更高效地“跑起来”;健全人工智能和数据安全领域的政策法规,为词元的生成、流转及交易划好“红线”;打通大模型商业价值闭环,培育“模型即服务”“智能体即服务”等新业态,实现技术创新与商业模式创新“双向奔赴”。
推动词元经济健康发展,不应止步于词元规模的快速增长,更应着眼于发展质效的全面提升。唯有系统破解词元经济发展面临的堵点,充分释放数据要素的价值潜力,方能夯实我国人工智能产业高质量发展的根基。(文/刘园园)
【责任编辑:朱家齐】




