
今天,火山引擎公布了一个数据,豆包大模子日均 Token 使用量打破 120 万亿。
三个月前,这个数字是 60 万亿。2024 年 5 月豆包大模子刚发布的时分,是目下的千分之一。
120 万亿 Token 是什么成见?
按 3 月国内主流大模子约 2-4 元/百万 Token 的输入价钱粗算,这意味着每天有 3 到 5 亿元在 GPU 上撤废。一年下来便是千亿级开销,非常于烧掉网易一整年的营收(网易 2025 年全年净收入 1126 亿元)。而这仅仅一家公司、一个模子平台、一天的量。

这个数字放在更大的盘子里看更有酷爱。
3 月 23 日,中国发展高层论坛 2026 年年会透露:本年 3 月,中国日均 Token 调用量打破 140 万亿,对比 2024 年头的 1000 亿,两年增长超千倍。同月,中国 AI 大模子周 Token 调用量相连三周超越好意思国。OpenRouter 数据领路,3 月第三周大师 AI 大模子总调用量 20.4 万亿 Token,中国占了 7.359 万亿,大师份额 36%。
误点 LatePost 此前报谈过另一个细节:大师日均 Token 浮滥量高出 100 万亿的公司,只好三家。OpenAI,Google,字节向上。
更值得琢磨的是,OpenAI 和 Google 的 Token 浮滥来炫夸师市集,而字节向上的主要来自中国。一个以国内市集为主的平台,Token 蒙胧量也曾和两个大师化巨头平起平坐。国外部分还在爬坡。
火山引擎总裁谭待拆解了增长背后的两个引擎:AI 视频创作爆发,AI 智能体加快普及。
这两件事在以前三个月同期「东谈主传东谈主」了。

▲ 火山引擎总裁 谭待
龙虾来了,Token 的烧法变了
OpenClaw 爆火之后,通盘东谈主齐在谈 Agent。一只「龙虾」让通盘行业刚烈到:Agent 期间的 Token 浮滥逻辑跟聊天期间饱和不同。
以前你跟大模子对话,一问一答,几百个 Token 就够。目下一个 Agent 要我方念念考、推敲、调器具、查验成果、出错了还得自我变嫌,一个复杂任务跑下来,Token 浮滥是世俗对话的几十甚而上百倍。
火山引擎我方的 ArkClaw 便是个缩影。秒级配对飞书,微信、钉钉、微博也能接入,升级了网盘作念端云协同。每一个「自动」的背后,齐是 Token 在高速流转。
谭待提了一个判断:企业用好 Agent 的要津是三件事,模子、安全、技巧(Skills)。

模子是 Agent 的大脑,本年 2 月发布的豆包大模子 2.0 在视觉意会上也曾踏进大师第一梯队,国内第一。安全是底线,火山引擎刚拿下信通院「智能助千里着平安能体家具果然才调认证」和「安全驻扎家具有用性认证」双认证,国内独一。
但光有机灵的脑子和安全的笼子还不够,Agent 得有手有脚,颖悟活。Skills 生态的广度径直决定了 Agent 才调的天花板。
这亦然本日另一个重磅音问的布景:OpenClaw 首创东谈主 Peter Steinberger 和火山引擎共同通告,两边共建的 ClawHub 中国镜像站(mirror-cn.clawhub.com)认真开动运营。
之前国内开垦者用 ClawHub 上的 Skills,不时碰到拜访慢、不安静的问题。镜像站赓续的便是这个痛点:高频拜访不再卡,Skills 更新能实时同步。Peter Steinberger 甚而在发布现场用「龙虾」生成了一段视频来通告这个音问。
在火山引擎平台上,累计 Token 使用量高出一万亿的企业客户,也曾从客岁底的 100 家增长到 140 家。三个月多了 40 家「万亿俱乐部」成员。
Seedance 2.0 通达公测:企业级视频生成有了「安全底座」
归拢天,火山引擎还通告 Seedance 2.0 面向企业用户认真通达 API 公测。
Seedance 2.0 是视频生成界限的大师 SOTA 模子,但让它对企业真实可用的,不仅仅生成质料。火山引擎为它建了一套遮掩全进程的肖像与版权安全圭臬,从输入素材的合规校验,到生成过程中的肖像权保护,再到输出实质的版权风陡立挠。Deepfake、侵权这些让企业法务部夜不行寐的问题,亚搏app官网在模子层就作念了阻挠。
这套安全机制遮掩视频生成触及的各式模态和创作前后的一谈设施。说白了,火山引擎采纳在模子最火的时分,先把安全门焊死,再把 API 钥匙交给企业。
对企业来说,这赓续的是一个很施行的问题:敢用。 品牌告白、电商视频、营销物料,这些场景对版权和肖像的敏锐度极高。莫得安全兜底,性能再强企业也不敢大限制接入。
谭待形容了企业 Agent 修复的两条旅途:敏态和稳态。 敏态 Agent 像 ArkClaw,是职工的「立异检修场」,让每个 HR 造成更好的 HR,让每个分析师造成更好的分析师。稳态 Agent 则把考证过的最好抓行进程化、限制化,嵌进契约交游、分娩赓续这些容不得幻觉的场景。
两条线不是二选一,是一个飞轮:个体立异在 ArkClaw 里激励,千里淀到 HiAgent 造成组织才调,再通过 Skill 和 API 反哺给每个一线职工。
120 万亿背后, Token 工场崛起
黄仁勋最近定了个调,到 2027 年,大师筹商需求将打破 1 万亿好意思元。他说 Token 是新期间的基础货币,数据中心不再是存储文献的仓库,而是分娩 Token 的工场。
那接下来就必须追问一个问题:谁在为这些 Token 买单?
火山引擎平台上 140 家企业的累计调用量破万亿,换个角度想,AI 的老本结构正在从「一次性买模子」造成「按呼吸计费」。而 Token 价钱,正在暴涨。
以前一个月,加价的音问像多米诺骨牌相同接连倒下。
智谱一个月内两次调价,GLM-5-Turbo 涨 20%,GLM Coding Plan 中国区涨 30%、国外涨超 100%,一季度 API 举座订价较上一代擢升 83%。智谱 CEO 张鹏在事迹讲解会上说了一句书不宣意的话:涨了 83%,调用量如故增长了 400%,供不应求。
此外,3 月 18 日归拢天,阿里云和百度智能云同期发布加价公告,AI 算力家具上调 5%-30%,存储涨 30%。腾讯云更早一步,3 月 13 日就治愈了智能体开垦平台的计费计策,部分模子涨幅高出 4 倍。

再往前看,亚马逊 AWS 1 月对机器学习容量块加价 15%,谷歌云也在同期偷偷调高了数据传输行状价钱。
国内三大云巨头加上国外两大巨头,在归拢个季度里集体加价,不是随机。 有东谈主算过一笔账:OpenClaw 用户的单日东谈主均 Token 浮滥量是传统聊天用户的 20-50 倍。
当海量用户同期把 Agent 跑起来,需求端的增速远远跑在了供给端前边——GPU 产能、电力、数据中心,齐需要夯实基础。黄仁勋说 Token 是基础货币。但货币不错存,不错囤,不错等增值。Token 不行。Token 分娩出来的那一刻就被浮滥掉了,更像电力。
而电力这个词,从来齐不仅仅时间问题亚搏app官网版,谁为止了发电和输电,谁就拿到了订价权。电网要受监管,通讯要发抓照。Token 呢?目下还莫得东谈主回报这个问题,但每个厂商齐想成为谜底。
声明:新浪网独家稿件,未经授权拦阻转载。 --> 亚搏体育官方网站 - YABO
备案号: