凯时AG

环球热门新闻资讯
2026-06-14 21:50:04
首页 > 新闻 > 时政要闻 > 正文

Claude刷爆5亿!一夜涨60倍,,,,,,你的Token账单还撑得 。。。 ???

新智元报道

【新智元导读】Claude账号忘设上限,,,,,,一月烧光近5亿美元!开发者每月破费从29美元变750美元,,,,,,尚有的从50美元一起狂飙到3000美元:你的Token账单还撑得住吗 ???

1个月烧出5亿美元账单!

克日,,,,,,科技圈曝出一桩惊天乌龙 。。。 。据Axios报道,,,,,,一家企业在短短1个月内,,,,,,竟然在Claude上刷爆5亿美元!

原因令人哭笑不得:治理层在给员工开通Claude账号权限时,,,,,,忘了设置使用额度上限 。。。 。

着实,,,,,,AI账单爆仓的远不止这一家 。。。 。

今年4月,,,,,,一名谷歌云用户因果真服务中遗留的API key被滥用,,,,,,原本只有7美元预算的账户,,,,,,一夜之间收到了1.8万美元的账单 。。。 。

这个倒运用户名叫Jesse Davies,,,,,,是一名澳大利亚AI照料、Agentic Labs首创人 。。。 。他给自己的Google Cloud账户设了两道包管:一个10澳元(约7美元)的预算预警,,,,,,一个1400美元的硬性消耗上限 。。。 。

据Tom's Hardware报道,,,,,,攻击者发明了他几个月前从AI Studio宣布的一个Cloud Run服务,,,,,,发了6万多个请求,,,,,,两道包管都没拦 。。。 。赫说ヅ趟阌醒映,,,,,,等系统反映过来,,,,,,金额已经飙到了1.8万美元 。。。 。

5月中旬,,,,,,开源项目OpenClaw的首创人Peter Steinberger在X上贴出一张截图:30天,,,,,,OpenAI API账单130万美元 。。。 。

他的团队只有三个人,,,,,,但他们指挥的100个Codex智能体在并行跑:30天烧掉6030亿个Token、跑出760万次请求 。。。 ;;;;;;购,,,,,,这130万美元并非他自掏腰包 。。。 。

Steinberger今年2月加入了OpenAI,,,,,,这130万美元被看成一次内部实验:测试若是不思量Token本钱,,,,,,AI编程能跑到什么极限 。。。 。他增补道,,,,,,这是Codex「Fast Mode」(高速档计费)的效果,,,,,,关掉之后约莫30万美元 。。。 。

更早一些,,,,,,Uber的CTO Praveen Neppalli Naga也曾向The Information认可,,,,,,公司4月份就把整年的Claude Code预算烧光了,,,,,,他们的COO也果真体现,,,,,,AI本钱越来越「难以自圆其说」 。。。 。

5亿、130万、1.8万,,,,,,金额虽然差出几个数目级,,,,,,却指向统一个事实:

在智能体时代,,,,,,失控的密钥、昼夜无休的智能体军团、忘了设上限的账号:任何一个,,,,,,都能让你的Token账简单夜刷爆 。。。 。

AI账单为什么会爆仓 ???

谜底主要藏在计费方式的转变里 。。。 。

从今年4月起,,,,,,OpenAI的包月计费方式最先转向按Token用量计费 。。。 。

4月2日,,,,,,Codex计费从按新闻估算改成按Token用量对齐:输入、缓存输入、输出三类Token脱离算 。。。 。4月23日,,,,,,这套规则扩展到所有Enterprise、Edu、Health、Gov方案:月费里那笔看不见的折扣被抽掉了 。。。 。

GitHub也紧随厥后,,,,,,刚刚官宣:所有Copilot套餐从2026年6月1日起,,,,,,转向按用量计费 。。。 。旧的高级请求逻辑作废,,,,,,换成AI额度,,,,,,按输入Token、输出Token、缓存Token的现实消耗,,,,,,比照每个模子的API费率结算 。。。 。

GitHub官方诠释了这么做的原因:

现在一个快速的谈天提问,,,,,,和一次跑好几小时的自主编码使命,,,,,,用户花的钱一样多 。。。 。GitHub一直在替那些跑重度使命的用户买单,,,,,,但这套模式已经不可一连 。。。 。

AI智能体崛起之前,,,,,,谈天和补全本钱差未几,,,,,,月费兜得住 。。。 。

智能体崛起之后,,,,,,一次使命能一连跑几小时、改动整个代码库,,,,,,重度用户和轻度用户的本钱差可以拉到几个数目级 。。。 。月费制在这种差别眼前,,,,,,直接崩了 。。。 。

新闻一出,,,,,,Reddit和X上一片哗然 。。。 。

一位ID为JBusu的开发者晒出了账单截图,,,,,,直言新定价「就是个笑话」 。。。 。原本28.12美元/月的开销,,,,,,按新制要付746.01美元,,,,,,他已决议退订,,,,,,「这个价钱,,,,,,我自己租云服务器都还自制」 。。。 。

另一名用户截图更夸张,,,,,,用度从50美元一起狂飙到3000美元,,,,,,他说没想到定价这样离谱,,,,,,「尚有人继续订阅吗 ???」

不过也有Copilot老用户出来反驳:这些极端账单大都是vibe-coder(凭感受编码者)们不把烧Token当回事给烧出来的,,,,,,未必能代表正常使用 。。。 。

一位老用户在谈论区留言:「我整天都在用,,,,,,月尾基本不逾额,,,,,,很难相信这是事情重漂后的差别 。。。 。」另一位则更直接:「就是有人要全自动的YOLO模式开发,,,,,,让AI随便跑 。。。 。这种铺张被剔除,,,,,,对其他人反而是好事 。。。 。」

有一点必需清晰:GitHub没有破除月费,,,,,,基础订阅价钱并没有变 。。。 。真正变的是特殊用量、智能体使命、更贵的模子挪用,,,,,,以后进入用量计费 。。。 。

被攻击最大的,,,,,,是那些靠Copilot跑长链使命的重度智能体用户 。。。 。

被自己人玩坏的排行榜

月费失守,,,,,,一面是平台改了计费规则,,,,,,另一面是用AI的人,,,,,,自己也在拼命烧 。。。 。

5月,,,,,,Business Insider报道,,,,,,Amazon下线了一个名叫KiroRank的内部AI使用排行榜 。。。 。

该报道援引知情人士的话称,,,,,,这个榜单悄悄催生了一种希奇的事情方式:部分员工为了在榜单上多爬几位,,,,,,会去刷一些并不解决现实问题的Token消耗,,,,,,纯粹为了排名 。。。 。

事情曝出之后,,,,,,Amazon高级副总裁Dave Treadwell直接向全员喊话:「别为了用AI而用AI 。。。 。用它去解决客户问题,,,,,,解决营业问题,,,,,,去立异 。。。 。」

这事虽然有点荒唐,,,,,,但绝不料外 。。。 。当「烧Token」能上榜,,,,,,员工自然就会去烧Token 。。。 。

硅谷给这种征象起了个专门的名字:Tokenmaxxing(极限烧Token),,,,,,把消耗量当生产力 。。。 。

Axios的报道里也提到,,,,,,有CTO发明员工拿AI模子查天气、写日常邮件,,,,,,简朴到不可的事,,,,,,套上最贵的前沿模子,,,,,,账单就能悄无声息地飞涨 。。。 。

KiroRank并非Amazon官方审核系统,,,,,,而是员工自觉搭的非正式工具 。。。 。但它清晰地袒露了一个经典的治理学纪律:当KPI设错的时间,,,,,,人就会用最智慧的方式钻空子 。。。 。

把「用了几多」等同于「干得好欠好」——这正是这一轮AI铺张的制度性泉源 。。。 。

算Token账的人,,,,,,已经在赚钱

Token账单焦虑的另一面,,,,,,有人悄悄把它做成了生意 。。。 。

第一条路:用上下文喂饱AI 。。。 。

Glean正是Arvind自家公司 。。。 。它做的就是企业AI事情助手:把疏散在公司各处的知识统一买通,,,,,,让员工的AI直接拿到上下文,,,,,,不必再四处翻箱倒柜 。。。 。AI少绕路,,,,,,烧的Token自然就少 。。。 。

这套机制让Glean的年度营收15个月翻三倍,,,,,,跨过3亿美元,,,,,,客户包括Databricks、Reddit、Samsung 。。。 。

第二条路:把活分给对的模子 。。。 。

模子路由首创公司Factory AI干的就是这件事:自动把每个使命派给最合适的模子,,,,,,简朴使命走自制档,,,,,,重大使命走顶配 。。。 。Arvind也讲过:路由做对了,,,,,,能省10倍 。。。 。

这两条路殊途同归:让AI干活,,,,,,但别让它乱烧 。。。 。

学术圈的研究,,,,,,也在为这种转向涤讪 。。。 。

https://arxiv.org/pdf/2604.22750

2026年4月的一篇arXiv论文,,,,,,第一次系统拆解了智能体编码使命究竟怎么烧钱 。。。 。

结论一:智能体使命的Token消耗,,,,,,可达通俗代码推理和代码对话的上千倍,,,,,,推高本钱的主因是输入Token 。。。 。

结论二:统一个使命跑多次,,,,,,Token消耗能差出30倍 。。。 。

结论三:更高的Token消耗,,,,,,并不必定带来更高准确率 。。。 。精度往往在中等本钱处见顶——再往上烧,,,,,,钱花了,,,,,,效果反而饱和 。。。 。

论文还发明,,,,,,前沿模子连展望自己要烧几多Token都做不到,,,,,,普遍低估真实本钱 。。。 。

你以为多花钱就能多服务 。。。 。现实是钱花了,,,,,,活纷歧定更好,,,,,,预算还算禁绝 。。。 。

当AI账单最先赶超人力本钱

「这是我影象中第一次,,,,,,手艺本钱最先和人力本钱持平 。。。 。」

5月29日,,,,,,Glean CEO Arvind Jain在接受CNBC记者Deirdre Bosa采访时这样讲道 。。。 。

英伟达应用深度学习副总裁Bryan Catanzaro的视察也印证了这一点 。。。 。

他在Axios访谈里提到:关于他的团队来说,,,,,,算力本钱已经远远凌驾员工薪资 。。。 。

类似的征象正在多家公司浮现:从做企业AI的Glean,,,,,,到卖AI算力的英伟达,,,,,,再到用AI的Uber,,,,,,都在重新审阅这笔账 。。。 。

在Arvind看来,,,,,,历史上手艺只是企业整体本钱里很小的一块,,,,,,但现在AI本钱已经能追平人为单了,,,,,,许多企业的年度AI预算通常都是一到两个月就烧光 。。。 。

已往一年,,,,,,AI使用率是被敬重的指标:多用就是先进,,,,,,烧Token就是拥抱未来 。。。 。现在,,,,,,许多企业最先反思那句质朴的话:这些烧掉的Token,,,,,,究竟换来了什么 ???

免费包月畅用的窗口期,,,,,,恰恰正在此时关上 。。。 。

接下来,,,,,,摆在所有开发者眼前的是这样一个问题:怎样精打细算,,,,,,让每一个Token施展出最大价值 。。。 。

未来真正的赢家,,,,,,毫无疑问将是最先学会算Token账的谁人 。。。 。

参考资料:

https://x.com/dee_bosa/status/2060791500049613306%20

https://www.cnbc.com/2026/05/29/-tokens-or-humans-the-new-corporate-trade-off.html%20

https://www.axios.com/2026/05/28/ai-spending-roi-enterprise-costs%20

https://www.businessinsider.com/amazon-ai-leaderboard-tokenmaxxing-2026-5

编辑:元宇

中新社北京6月14日电 6月13日,,,,,,中共中央政治局委员、外交部长王毅在乌兰巴托同蒙古外洋长巴特策策格举行谈判 。。。 。

责任编辑:林怡雯

【网站地图】