| 代码 | 名称 | 当前价 | 涨跌幅 | 最高价 | 最低价 | 成交量(万) |
|---|
①各大模型的token调用量自2026年1月下旬出现明显跃升;②国产大模型站上舞台中央;③智能体在执行任务时,整体token消耗或提升十倍以上 ,而对应的算力需求将增长百倍以上。
最近,大模型token调用量井喷成为关注点 。OpenRouter最新数据显示,各大模型的token调用量自2026年1月下旬出现明显跃升。
与此同时 ,国产大模型站上舞台中央。2月9日-15日这周,中国模型以4.12万亿token的调用量,首次超过同期美国模型的2.94万亿token 。16日-22日这周 ,中国模型的周调用量进一步冲高至5.16万亿Token,三周大涨127%,而同期美国模型调用量跌至2.7万亿Token。平台调用量排名前五的模型中 ,有四款来自中国厂商,分别为MiniMax的M2.5、月之暗面的Kimi K2.5 、智谱的GLM-5以及DeepSeek的V3.2。这四款模型合计贡献了Top5总调用量的85.7% 。
其中,M2.5一鸣惊人 ,在发布后12小时内登顶OpenRouter热度榜,一周内登顶调用量榜首,周调用量暴涨至3.07T tokens,超过Kimi K2.5、GLM-5与DeepSeek V3.2三家的总和。
OpenRouter是全球最大的大模型API聚合平台 ,可为开发者提供统一API接口,以访问全球数百种大语言模型。其核心功能包括多模型调用、智能路由优化和透明的性能排行榜,旨在解决多模型集成复杂和厂商封锁问题 。
当目光聚焦于AI应用普及 、国产模型崛起等 ,不应该忽视数据背后的结构性变化。
模型调用量因何在近期爆发?排名靠前的为何是M2.5等新秀?
多家机构认为,一方面是,春节带来AI应用渗透率提高 ,token消耗量有了总体提升;另一方面,AI模型的Agent(智能体)场景广泛落地,单次任务token消耗大幅增加。
伴随1月下旬以来的这一轮增长 ,梳理AI行业的新动向,也能为上述问题提供思路 。
首先是OpenClaw爆火,这是一个能让大模型获得本地操作系统权限的开源智能体框架 ,可让AI可以自己执行Shell命令、操作文件系统,实现所谓的“本地代理主权”。当地时间2月15日,OpenClaw的创造者Peter Steinberger正式加入OpenAI,负责推动“下一代个人智能体 ”的研发。
随后多个面向智能体场景的大模型发布 ,反响热烈——
稀宇科技(MiniMax)于2月13日发布MiniMax M2.5,称该模型为全球首个为智能体场景原生设计的生产级旗舰模型。其发布后七天的调用量即突破3.07T tokens,凭借在编程和Agent工作流中的卓越性能与极低的成本 ,成为开发者首选 。
月之暗面(Moonshot AI)于1月27日发布KimiK2.5,该模型采用原生多模态架构,能通过调度多达100个“Agent分身”并行工作 ,将复杂任务效率提升3到10倍。该模型在多个细分榜单(如编程、工具调用)中均排名第一,其调用量远超Gemini 3和Claude模型。
智谱于2月12日发布GLM-5,该模型参数规模进一步扩展 ,采用了稀疏注意力机制,是其专为复杂系统工程与长程Agent任务设计的旗舰模型 。凭借免费 、200K上下文窗口等优势,该模型发布后用户迎来高速增长 ,智谱对Coding Plan先后进行了限售、涨价等动作。
这些模型聚焦于提升编程能力和智能体任务的自动化水平,这两大能力让AI的应用场景从私人化娱乐向生产环境转变,专业开发者的token消耗远比普通对话密集,这类需求一旦被激活 ,带动的调用增量随之大幅攀升。
OpenRouter的官方数据证实了这一点,该平台超70%的token消耗量,来自互联网大厂、中大型企业 、专业开发者的生产环境常态化调用 ,这类场景的单次token调用量远超个人用户、小型测试项目等 。官方确认,过去数周内,平台长文本生成需求显著上升 ,在100K至1M token区间,MiniMax M2.5的调用量处于领先位置,这个区间正是智能体工作流的典型消耗场景。
可以说 ,这轮token消耗量爆发,直接反映出大模型发展的新趋势,AI正从“快思考”走向“慢思考 ”、从“工具”走向“劳动力” ,各大AI前沿公司力研的智能体功能正属于“慢思考 ”的范畴。
当模型面对复杂任务(如“写一个电商网站的代码”)时,它不再直接输出答案 。它会先“自言自语”:拆解需求 、设计架构、编写函数、检查bug、优化性能,因为AI开始“在脑子里反复推演 ”。每一次推演 、每一步逻辑链的建立,都在消耗token。这种“推理密度”的增加,使得token消耗的增长速度远远超过了用户数量或提问次数的增长速度 。
中信证券称 ,AI应用场景从简单对话,向多模态(文本/图像/音频/视频)、AI智能体升级,单次任务token消耗呈指数级上升。该机构认为 ,token的爆发式增长,本质上反映出AI推理需求的指数级扩容。
华泰证券此前预测,随着推理范式变化 ,智能体加速落地,未来算力需求中存在两个倍数关系,共同决定了算力需求的广阔空间:
1)推理和token调用量之间不是线性关系 ,这是因为多智能体协作和多工具调用会带来token消耗量加速增长;
2)算力需求与token的增长之间不是线性关系,这是因为随着推理过程更加复杂,同样算力条件下计算时间也将增长 ,实时性和交互性带来对计算速度的要求。
该机构认为,与Chatbot相比,智能体在执行任务时会进行任务的分解与编码,将带来交互次数、任务复杂度 、使用频率的提升 ,整体token消耗或提升十倍以上,而对应的算力需求将增长百倍以上,长期看好算力需求的持续快速增长 。
(文章来源:财联社)
专业配资平台排名第一:炒股开户流程-水贝黄金料商暴雷消息夸大不实
股票配资正规平台排名:股票网炒股配资开户-27岁OpenAI前研究员姚顺雨入职腾讯:任总办首席AI科学家 负责大语言模型部等
股票配资网站开户:炒股配资正规平台-亚马逊云计算盛会开幕!CEO今晚登台 新AI模型和AI芯片即将亮相?
开户配资:正规配资炒股平台网址-多部门明确反对车企之间无序“价格战” 向“内卷式”竞争说“不”
个人炒股配资:股票在线开户正规平台-印度客机坠毁前机舱内最后30秒视频曝光?
网上炒股配资开户:有哪些正规股票的加杠杆平台-上市仅3个月 苹果iPhone Air降价2000元促销
还没有评论,快来说点什么吧~