用户名:  密码:   
网站首页即时通讯活动公告最新消息科技前沿学人动向两岸三地人在海外历届活动关于我们联系我们申请加入
栏目导航 — 美国华裔教授专家网科技动向科技前沿
关键字  范围   
 
一个月烧掉5亿美元Token,多家美国科技巨头紧急叫停
来源:新浪科技 | 作者:郑峻 | 2026/6/17 13:52:03 | 浏览:5 | 评论:0

一个月烧掉5亿美元Token,多家美国科技巨头紧急叫停AI时代什么最贵?在经历了此前哄抢显卡和争夺人才的热潮之后,现在看来是算力,是Token成本。不仅普通企业只能省吃俭用,连科技巨头都没有余粮了。“Tokenmaxxing”迅速变成了一个笑话。

云服务公司Box CEO亚伦·莱维(Aaron Levie)表示,他近期参加了一场有众多顶级企业高管的晚宴,发现商界领袖们讨论最多的话题,不是宏观经济议题,而是他们企业的Token成本。

莱维所说的并不令人意外。Uber的CTO普拉文·内帕利·纳加(Praveen Neppalli Naga)上个月坦承:公司将Claude Code部署给约5000名工程师后,短短四个月内就将全年AI预算烧光殆尽,让他措手不及。

Uber高层的本意是推广工程师们普及AI工具,从这个角度来看,他们达到了目的。上个月Uber工程师的Claude Code月使用率已飙至95%。但高层并没有考虑到另一面,单个工程师每月产生的API成本高达500到2000美元。

面对着目瞪口呆的Token预算,即便是Uber这样市值1500亿美元的大企业都不得不紧急制定严苛的分级管理,限制员工的使用流量,像当年节省纸张一样精打细算着每一个Token的成本。

 科技巨头都烧不起了

令人意外的是,收紧AI预算的不仅有Uber这样的中型企业,甚至还包括了微软和亚马逊的超级云计算巨头。

去年年底,微软最核心的Experiences and Devices部门——覆盖Windows、Microsoft 365、Outlook、Teams及Surface全线产品的核心工程团队——率先在内部大规模推行Claude Code。

虽然微软对外强调并没有将AI使用量纳入员工绩效考核体系,但他们内部却流传着一份开发部门负责人朱莉娅·刘松(Julia Liuson)的内部备忘录,称AI的使用“不再是可选项,而是每个岗位、每个级别的核心要求”。

但仅仅六个月后,这场实验就不得不被紧急叫停。这并不是因为效果不好,而是员工们用得太爽,用量太猛,才让IT部门猝不及防。就在本周,微软开始着手关闭大部分内部Claude Code授权。数以千计的工程师被强制迁移回微软自家的GitHub Copilot CLI,以便进行成本管控。

然而,更触目惊心的案例来自Axios本周的独家报道。一家科技巨头因为没有对员工的Claude许可证设置使用上限,在短短一个月内烧掉了5亿美元。这不是一个抽象的数字:5亿美元相当于许多中型科技公司的全年营收。

虽然报道没有实名,但外界普遍认为这说的是亚马逊,因为亚马逊此前在公司内部大力推行AI工具,并将开发者的AI使用量纳入内部排行榜考核,要求超过80%的开发者每周必须使用AI。

这套考核机制迅速催生了一个新词:Tokenmaxxing——专指员工为了刷高排行榜数据而人为制造无意义AI消耗的行为。亚马逊员工们用MeshClaw自动化那些根本不需要AI的日常任务,让AI智能体在后台空转,只为让自己的token消耗数字好看。

面对每个月高达5亿美元的天价Token账单,亚马逊高管最终意识到,员工大量使用AI是为了提升排名,而不是解决实际业务问题。

一个月烧掉5亿美元Token,多家美国科技巨头紧急叫停
就在上周,亚马逊放弃了AI使用量考核,要求员工高效使用AI工具。一位亚马逊高管甚至告诫旗下员工,不要单纯地为了使用AI而使用AI。这种态度和此前形成了鲜明对比。

同样的刷Token闹剧也在Meta上演。Meta首席人力官贾内尔·盖尔(Janelle Gale)明确宣布,AI使用情况与业务影响力将从2026年起正式纳入绩效考核体系,顶尖员工的奖金上限将超过年薪的200%。

一个月烧掉5亿美元Token,多家美国科技巨头紧急叫停
Meta甚至要求员工必须在办公电脑上安装一套软件,在详细追踪他们的AI使用情况的同时,也为AI自动化办公提供训练数据。Meta CTO安德鲁·博斯沃思(Andrew Bosworth)曾公开表示,目标是未来开发能够自主执行工作任务的AI代理。

博斯沃思表示,他最顶尖的工程师花在AI Token上的钱相当于自己的年薪,并以此作为生产力倍增的证据。在这套指挥棒下,Token消耗量从一个工程指标悄然蜕变为职场晋升的通货。

Meta内部甚至出现了一个名为“Claudeonomics”的非官方排行榜,追踪全公司约8.5万名用户的Token消耗量。结果在30天的统计窗口内,该排行榜显示的总使用量超过60万亿个Token。排行榜曝光两天后,因“内部数据遭外部获取”而紧急下线。

 账单让企业瞬间清醒

这种烧不起Token的戏剧性局面似乎反转得太快。因为就在不久之前,科技企业还在纷纷鼓励旗下员工全面转型AI,为员工提供无限度的Token额度。

在今年3月的英伟达GTC期间,黄仁勋公开表示,计划为英伟达每一个员工提供每年50万美元的Token额度。黄仁勋甚至强调,如果哪个员工在年底前没有把这50万美元的Token额度用完,他甚至会感到“失望”,因为这意味着员工没有充分利用AI来重塑自己的工作方式。

在这场科技巨头争相向华尔街讲述AI转型故事的时候,Token消耗量被当成AI落地深度的代理指标。Token消耗得越多,就越证明AI渗透进了工作流。于是,消耗量本身成了目标,生产力反而成了附带品。

但现实情况是,将AI使用量纳入绩效考核只会带来毫无意义的Token浪费。根据美国软件智能平台Jellyfish的估算,在轻度使用AI的情况下,合并一次拉取请求的成本仅为0.28美元,但在重度使用AI的情况下,这一成本可能瞬间就会急剧飙升到89.32美元。Token消耗得更多了,但交付的产品并没有变多,只是带来了更大的账单。

科技媒体Axios用一个词精准概括了当下的企业AI困境:sticker shock——价格虚高综合征。那些曾经急于拥抱AI的企业,正在集体面对膨胀的IT成本、难以量化的生产力提升,以及员工日益滋长的怀疑情绪。

高盛最新预测显示,随着企业和消费者大规模采用AI智能体,到2030年全球Token消耗量可能增长24倍,达到每月120千万亿(Quadrillion)。这是一个令人眩晕的数字——但数字本身并不创造价值。研究公司Mavvrik的调查显示,85%的企业AI成本预测误差超过10%;84%的企业表示,AI支出已将公司毛利率压低了6个百分点以上。

Gartner的预测则让人彻底清醒:即便到2030年AI推理成本下降近90%,企业AI总账单也不会因此变得便宜。原因很简单——智能体工作流所消耗的token量,是普通单次对话的数百倍乃至数千倍;消费量的增长速度,完全足以淹没单价下降带来的红利。

“首席产品官们不应该把商品Token的通缩,误读为前沿推理能力的普惠化,”Gartner高级分析师威尔·萨默(Will Sommer)如此警告。

那些曾经以“打开AI、看看会发生什么”为策略的公司,正在补课——补那些本该在推广前就该建立的治理体系和成本管控机制。

Token账单正在倒逼企业重新思考一个最基本的问题:AI到底在为我解决什么问题?这个问题,在采购许可证之前就应该回答。现在,市场用账单替他们给出了答案。

Uber COO安德鲁·麦克唐纳(Andrew Macdonald)对此直言不讳:“AI成本越来越难以合理化。”这与他们CTO早先的表态形成了一组沉重的呼应:Uber的CEO甚至公开表示,他看不出极端的Token消耗量与真正交付有价值的产品之间存在任何明确的关联。

 重新开始雇佣员工

虽然很多企业正在以“AI可以替代人工”为由推行裁员,但Token成本急剧上涨与AI回报低效已经让一些企业开始踩起了急刹车。

瑞典金融科技巨头Klarna曾是AI替代人工最激进的鼓吹者。2024年,该公司CEO塞巴斯蒂安·西米亚特科夫斯基(Sebastian Siemiatkowski)宣称AI“已经能胜任人类所有的工作”,并以此为由冻结招聘、裁减约1200名员工,员工总数从2022年的5500人骤降至3400人。

然而到了2026年初,Klarna开始悄然反转:重新启动人工客服招募,并亲口承认决策失误——“成本不幸成为过于主导的评估因素,结果是服务质量的下降”。AI的确快,但它不擅长处理愤怒客户、复杂纠纷和需要共情的场景。Klarna用一次耗资巨大的回头路,给整个行业立下了一块警示碑。

澳大利亚联邦银行(CBA)的案例同样典型。2025年7月,这家澳洲最大银行宣布用AI语音机器人替代45名客服员工,理由是AI已能自动处理大量简单来电。然而现实迅速打脸:机器人上线后,客服来电量不降反升,顾客投诉激增,剩余员工被迫大量加班,管理层甚至亲自下场接听客服热线。仅仅一个月后,联邦银行向被裁员工公开道歉并支付补偿,宣布撤回裁员决定,邀请这45人悉数返岗。澳大利亚金融业工会将此称为“一次巨大的胜利”。

这两起事件,折射出AI时代一个尚未被充分正视的结构性陷阱:企业在规划AI替代方案时,往往只算了“省下多少人工成本”,却漏算了AI失效后的善后成本——顾客流失、品牌受损、重新招募培训,以及向员工赔付补偿。

研究机构Orgvue和Forrester的联合调查显示,那些急于用AI替代人力的企业中,有55%事后表示后悔。Token可以很便宜,但用Token替代人所付出的隐性代价,往往远比账单上的数字昂贵得多。

这场反转来得比任何人预期的都快。从黄仁勋在GTC舞台上宣布“员工烧不完50万美元Token我会失望”,到亚马逊高管告诫员工“不要为了用AI而用AI”,前后不过几个月。硅谷对Token的态度,完成了一次180度的弧线。

但这并不意味着AI时代结束了,而是意味着它真正开始了。此前那个“大水漫灌”式的推广阶段,本质上是一场以算力浪费为代价的组织实验——企业用真金白银买单,用员工的时间陪跑,用客户的信任背书。现在账单摆上桌面,该算清楚的事终于到了要算的时候:哪些场景真的需要AI,哪些只是在为排行榜表演。

Gartner那句话值得所有决策者贴在办公室墙上:不要把Token的降价,误读为AI能力的普惠。真正的问题从来不是Token贵不贵,而是每一个被消耗掉的Token,究竟在为谁创造价值。

相关栏目:『科技前沿
2026年企业AI发展趋势研究报告:五大拐点信号表明,规模化落地的窗口已经打开 2026-05-28 [595]
深度解读Anthropic创始人提出的人类第0世界 2026-05-28 [565]
Globant:2026年技术趋势报告 2026-05-28 [520]
两台车,改变了一个时代 2026-05-28 [521]
AI不是思维的替代品,而是思辨能力的放大器 2026-05-05 [1309]
刚刚,美国AI霸主换了!Anthropic年收300亿,碾压OpenAI 2026-05-05 [1265]
超过人类状元,ChatGPT以最高分通过日本顶尖大学入学考试 2026-05-05 [1258]
斯坦福HAI最新报告出炉:中国模型追平美国,95%企业AI投资零回报 2026-04-27 [1532]
中层的坍塌:两千年管理史,终结于一个AI循环 2026-04-27 [1561]
“输入电子,输出Token”:黄仁勋重写AI投资坐标系 2026-04-27 [1518]
相关栏目更多文章
最新图文:
:北京和上海金融人的最新鄙视链 :日本政府《氢能利用进度表》 :美国《2016-2045年新兴科技趋势报告》 :天津工业大学“经纬英才”引进计划 :浙江财经大学国际青年学者论坛的邀请函 (10/31-11/1) :美国加大审查范围 北大多名美国留学生遭联邦调查局质询 :天安门广场喜迎“十一”花团锦簇的美丽景象 马亮:做院长就能够发更多论文?论文发表是不是一场“权力的游戏”?
更多最新图文
更多《即时通讯》>>
 
打印本文章
 
您的名字:
电子邮件:
留言内容:
注意: 留言内容不要超过4000字,否则会被截断。
未 审 核:  是
  
关于我们联系我们申请加入后台管理设为主页加入收藏
美国华裔教授专家网版权所有,谢绝拷贝。如欲选登或发表,请与美国华裔教授专家网联系。
Copyright © 2026 ScholarsUpdate.com. All Rights Reserved.