当智能比人命还贵 / When Intelligence Costs More Than a Life
大洋一岸死于太贵,另一岸死于太贱 / One shore dies of the price, the other of the bargain
单价每年腰斩,账单却指数级飙升;大洋一岸的巨头贵到裁人喂 AI,另一岸把智能卷成白菜价、于是人人用得起、人人都不值钱——两条相反的路,通向同一个深渊。
导语:一句承诺的崩塌
每一轮技术革命,都先许下一句承诺,再用十年去兑现,或者用十年去食言。
蒸汽机许诺把人从体力里解放出来,结果把人塞进了流水线,按秒计酬。电报许诺让世界的距离归零,结果催生了第一批因为"消息太快"而崩溃的金融恐慌。互联网许诺让信息自由,结果养出了人类历史上最庞大的注意力收割机器。
人工智能的承诺,是这一切里最崇高、也最简洁的一句:机器将以趋近于零的边际成本,替换你养不起的那个人。
降本、增效、替代。三个词,撑起了万亿美元的市值,撑起了无数张裁员的 PPT,也撑起了普通人深夜里那点说不出口的恐惧——"它会不会,把我换掉?"
整整三年,没有人认真怀疑过这句承诺的前半截。大家争论的只是后半截:被替代的会是谁,什么时候轮到自己。至于"趋近于零的边际成本"这个大前提,被当作物理定律一样供着,无人触碰。
直到 2026 年的春天。
这句承诺,当着所有人的面,塌了。不是被竞争对手击穿的,是被自己的账单,一张一张,压垮的。
三记耳光:当卖铲子的人也喊贵
崩塌不是一声闷响,是三记接连扇下来的耳光。每一记,都打在最不该挨打的那张脸上。
第一记,扇在微软脸上。
5 月 14 日,微软给旗下五千名工程师发了一封内部信,内容朴素到近乎冷酷:六月底之前,卸载 Claude Code,换回我们自己的 GitHub Copilot CLI。
你要理解这一巴掌打在谁身上,才能听见它的响。微软是什么?是把"我们 30% 的代码已经由 AI 生成"写进 CEO 公开演讲的公司,是向 OpenAI 砸进 130 亿美元的公司,是把 Copilot 当作下一个十年旗舰、恨不得焊在每一个产品里的公司。AI 是它的信仰,是它的招股说明书,是它讲给华尔街听的整个故事。
可就是这家公司,悄悄把自己的工程师从一个对手的工具上,赶了回来。
为什么?表面的理由是钱——人均月开销 500 到 2000 美元,五千人,一年就是一笔让任何 CFO 心脏骤停的数字,而六月底恰好是微软财年的终点,关账之前砍掉这笔开支,账面会好看得多。但真正难堪的,是钱背后那件没法写进备忘录的事实:自家的旗舰,打不过对手的工具。员工不是被命令用 Claude Code 的,是自己用脚投的票。 给他们自由,他们就抛弃了 Copilot。
于是巨头做了它唯一能做的事——把人赶回那个更笨、但烧得起、并且是自家亲生的笼子里去。这不是一次采购流程的优化,这是一次当众的认输,只不过被体面地包装成了"平台纪律"和"工具收敛"。当一家公司宁可让工程师用更差的工具,也不愿继续给对手付账,它告诉你的不是它有多自律,而是这账单有多烫手。
第二记,扇在 Uber 脸上。
四个月。Uber 用四个月,烧光了它为整个 2026 年准备的 AI 编码预算。
更刺眼的是这把火是怎么烧起来的。Uber 给大约五千名工程师铺开了 Claude Code,然后——为了"鼓励采纳"——挂出了一块内部排行榜,按各团队消耗的 AI 用量排名次。你能想象接下来发生了什么。采纳率从 2 月的 32%,一个月内冲到 3 月的 84%。工程师们不是在用工具,他们是在刷榜。管理层亲手给一种本就容易上瘾的东西,装上了一台社交加速器,然后惊讶于它烧得太快。
Uber 的 COO 后来在采访里说,发现预算见底的那一刻是个"脑袋炸裂的时刻"。让他脑袋炸裂的,不只是钱没了,而是他忽然意识到自己面对的是一道荒诞到反人性的选择题:为了继续付 token 的账,他可能得裁掉那些正在烧 token 的人。 不是用 AI 替代人来省钱——是反过来,裁掉人,腾出预算,去喂 AI。叙事在这里彻底拧成了麻花:AI 不再是来替人省钱的,AI 成了那个要人让位、要人献祭的主人。
而且最致命的一刀还在后面。COO 坦承,公司根本画不出一条清晰的线,把暴涨的 token 消耗和"真正交付给用户的、更好的功能"连起来。采纳率的曲线很性感,账单的曲线很恐怖,可中间那条本该叫"价值"的曲线——模糊不清。烧得越来越多,但没人能证明烧出了什么。
第三记,扇在英伟达脸上——这一记最响。
英伟达是谁?是这场淘金热里卖铲子的人,是整个周期最大、也最稳的赢家。全世界都在亏钱买它的卡,它数钱数到手软。如果说这世界上有谁能让 AI 跑得便宜,那一定是它——它拿货最便宜,站在算力链条的最上游,离太阳最近。
可就是它的应用深度学习副总裁,对着 Axios 说了一句几乎是行业自爆的话:
"对我的团队而言,算力的成本,远超过员工的成本。"
请把这句话读三遍。连英伟达——连那个卖铲子、拿最低价、最该用得起 AI 的人——都养不起 AI。那么对于产业链下游、要按零售价买算力的千千万万家公司,"用 AI 无脑替人"这件事,从这位副总裁开口的那一刻起,就成了一个不需要再争论的伪命题。
而黄仁勋给这一切补了一个更冷的注脚。他说,一个年薪 50 万美元的工程师,每年至少应该烧掉 25 万美元的 token。
这句话被很多人当励志金句转发,但你听懂它真正的意思了吗?在巨头的算盘里,人已经不再是那个被 AI 替代的对象了。人,成了配给 token 的载体。token 才是主角,人是给主角刷副本的账号。一个工程师值不值钱,不再看他写了什么,而看他能不能、敢不敢,把那 25 万美元的算力喂下去。主仆,在这句话里,悄悄换了位。
悖论的内核:为什么越便宜,反而越贵
三记耳光打完,一个反直觉到近乎悖论的事实浮出水面:
推理 token 的单价,正以每年 60% 到 70% 的速度往下坠——这是芯片厂商、是高盛、是所有人都确认的趋势。可与此同时,企业的总账单,却在指数级地往上窜。
单价在雪崩,总价在飙升。便宜了,却更贵了。
这不是矛盾,也不是谁算错了账。这是一次范式换代时,必然要付的代价。要看懂它,你得看清 AI 这三年里,从一个东西,变成了另一个东西。
Copilot 时代的 AI,是一个文本框。
你问,它答。你给一句提示,它吐一段代码。一问一答,干净利落。这种交互是线性的、低频的、有明确上限的——你一天能问多少次,是有数的;每次消耗多少 token,是可预算的。它像一个随叫随到的顾问,你不叫,它就安静地待着,不花一分钱。这个时代的 AI 成本,是可以被关进 Excel 表格里、被 CFO 驯服的。
Agentic 时代的 AI,不再是文本框,它是一台不知疲倦也不知节制的状态机。
它不再"回答问题",它去"解决问题"。你给它一条指令——比如"帮我把这个支付模块重构一遍"——它不会回你一段代码就完事。它会在后台,自己跟自己说上成百上千轮话:先拆解任务,再调用工具,跑一遍,报错,读错误日志,自我修正,再跑一遍,再报错,再修……它构建起一个闭环,一个自给自足、自我循环、不撞南墙绝不回头的状态机。
它不是在回答你。它是在替你,把那个解决问题的过程,从头到尾,走一遍。而它活着的每一次心跳——每一轮自我对话、每一次工具调用、每一回 debug——都在按 token 收费。
于是你就明白了那条算式:单个 token 的单价,跌了一半;可由于智能体的自主循环,调用的频次,涨了一百倍、一千倍。前者是线性的恩赐,后者是指数的吞噬。硬件迭代辛辛苦苦从牙缝里省下的每一分钱,都被智能体永不闭嘴的内心独白,连本带利地吃了回去。摩尔定律省下的,被"自主性"花光了,还倒欠。
这里藏着一把锋利的刀,我得把它抽出来给你看。
高盛在 5 月那份《解码智能体经济》的报告里,预测到 2030 年,全球每月的 token 消耗将达到 1.2×10^17(120 千万亿)个,四年涨 24 倍。高盛给这个吓人的数字配了一个乐观的标签,叫"利润率拐点"——意思是,消耗虽然暴涨,但只要单价跌得够快,模型厂商和云巨头反而能迎来一波利润率的反转,钱会越赚越多。
听起来是张好牌。但请你死死盯住这张好牌的前提:它必须假设成本能够年降 60% 到 70%,才敢张开双臂去迎接这场消耗的海啸。 翻译成大白话就是——连最会算账、最不见兔子不撒鹰的华尔街投行,都得指望"幸好它会越来越便宜",才敢看好这门生意。
那么问题来了:当一个行业全部的繁荣,都建立在"幸好越来越便宜"这根独木桥上,它离"再便宜也撑不住"那个深渊,到底有多远?
答案是:只隔着一个采纳率的拐点。只要用量涨得比单价跌得更快——而 Agentic 时代的全部特征,恰恰就是用量会涨得快到失控——这座精算出来的乐观大厦,随时会从内部坍塌。
而这场"幸好越来越便宜"的全球竞赛,有一个国家,把它推到了所有人都没料到的极端。
中国:没有这个悖论,因为把智能本身也卷成了白菜价
到这里,一个很自然的直觉会冒出来,尤其是在中国的语境里:
中国大概,是在用某种"阉割版"的廉价 AI 吧?豆包、DeepSeek、千问、Trae……便宜是便宜,但终究是低人一等的替代品;能凑合干活,但够不着 Claude 和 GPT 那种"真智能"。我们用的是打折的、缩水的、二流的聪明。
这个直觉,错了。而且错得很彻底。真相比"阉割"两个字,要残酷得多,也深刻得多。
让我们把最硬的那把尺子拿出来量一量。SWE-bench Verified,是目前业界公认最不容易作弊的编程基准——它不考你会不会背语法,它把你扔进真实的开源代码库,给你一个真实的 GitHub 工单,看你能不能真的写出补丁、真的通过测试。这是"能不能干活"的考试,不是"看起来聪不聪明"的表演。
2026 年 5 月的成绩单是这样的:
- 顶端,是 Claude Opus 4.7、GPT-5.4,约 87 到 88 分。
- 紧随其后,DeepSeek V4 Pro,已经是开源阵营的第一,约 80 分,挤进了全球总榜的前五。
差,是真的差。差了七八分。我不打算像某些自媒体那样,把这七八分抹平,喊一句"国产已经追平"——那是话术,不是事实,而拆穿这种话术,恰恰是写这篇札记的本分。
但是——这七八分,是"能不能啃下最硬的那几个 bug"的差,不是"能不能干活"的差。
它落在能力分布最右端那条又陡又窄的尾巴上。那条尾巴上待着的,是那些需要跨十几个文件协调修改、需要在极长上下文里精密推理、需要理解人类含混到自己都说不清的意图的硬骨头。而你掂量一下自己日常的工作:写个登录接口、修个空指针、重构一段祖传屎山、把需求翻译成 CRUD——这些活,有几个走得到那条尾巴上去?
八成走不到。在那八成的疆域里,80 分和 88 分的手感,你几乎摸不出区别。两个模型都把活干完了,都通过了测试,你甚至分不清哪段代码是哪个写的。
所以真正悬殊的,并不是这七八分的智能。是接下来这个数字——价格。
我来把账算给你看。按每百万 token 计费:
| 输入 | 输出 | |
|---|---|---|
| Claude Opus 4.6 | $5 | $25 |
| DeepSeek V3.2 | $0.28 | $0.42 |
输出端,差了近六十倍。
六十倍。这不是"贵一点"和"便宜一点"的区别,这是两个物种。再叠上工具本体——通义灵码的基础版、开源免费的 CodeGeeX、Trae 的免费版——三件套的月费可以直接压到零,而它们已经能覆盖日常开发的绝大多数场景。
于是,那个在大洋彼岸把微软、把 Uber、把英伟达逼到墙角的悖论,在中国,根本就没有机会成立。
Uber 烧光预算,是因为 token 按美元定价,又挂了块排行榜放任用量狂飙;而中国这边,用六十分之一的单价,在八成的场景里交付了完全够用的能力。剩下那两成最硬的、只有顶端模型才啃得动的活,国内自有少数人去买全球最贵的那把刀——但绝大多数公司、绝大多数工位,这辈子都碰不到那两成,也就根本不需要那把刀。
所以,这不是阉割。这是中国把它在光伏上、在锂电上、在新能源车上干过的那一整套打法,原封不动地,搬到了"智能"本身上面。
那套打法大家太熟悉了:不跟你在最尖端的实验室里比谁的效率高出零点几个百分点,而是用整个产业链的规模、内卷和成本控制,把一件原本昂贵的东西,做到趋近于免费,然后用免费把整张牌桌掀翻。光伏组件曾经贵得只有政府补贴才装得起,现在便宜到铺满戈壁;动力电池曾经是电动车里最金贵的心脏,现在卷到厂商在发布会上互相比谁送得多。
现在,轮到智能了。
把奢侈品做成基础设施,把图腾做成水电。 这是这个国家最擅长的一门手艺,也是它最冷酷的一门手艺。
冷酷在哪?我们待会儿说。先看清这门手艺划出的那条真正的分界线。
世界对"智能"的态度,正在裂成两半。这两半之间的鸿沟,不在"高端"与"低端"之间,而在两种截然相反的定价哲学之间:
北美的哲学是:智能是奢侈品。
贵,有贵的道理。贵,本身就是价值的证明。黄仁勋说"年薪 50 万该烧 25 万 token",他不是在抱怨成本,他是在炫耀——把消耗本身供成了图腾,把那张吓人的账单,当成了勋章别在胸口。在这套哲学里,烧得起,是身份;烧得多,是先进。AI 是头等舱,是私人飞机,是只有少数玩家才入得起场的牌局,而正因为入场费高,场内的人才睡得着觉——壁垒还在,泡沫还体面。
中国的哲学是:智能是基础设施。
它的价值,不在稀缺,恰恰在于铺到趋零。像水,像电,像手机信号——一件基础设施存在的全部意义,就是让你彻底忘记它要钱。你拧开水龙头时,不会盘算这一瓢水值几分;你打开 App 让 AI 跑一段时,也不该感觉到 token 在燃烧。在这套哲学里,便宜不是妥协,便宜是目的;普及不是副产品,普及是武器。
两种哲学,没有高下,只有结局。
而中国这套哲学,藏着那把刀的第二刃。现在,该说它的冷酷了。
白菜价的诅咒:当智能免费,人就不值钱了
便宜的智能,从来不解放人。
记住这句话,因为它违背你被灌输了三年的所有直觉。所有人都告诉你,AI 普惠是好事,技术下沉是进步,让每个普通人都用得起最强的工具,是这个时代最大的善。
在某个抽象的层面,这话没错。但在你领工资的那个具体层面,它藏着一个谁都不愿意说破的诅咒:
当智能本身都被卷到趋近免费,那用智能造出来的一切,自然也跟着一文不值。
这是个简单到残忍的经济学。价格,来自稀缺。一样东西之所以值钱,是因为不是谁都能造出它。一个会写代码的人值钱,是因为大多数人不会写;一个能剪出精致视频的人值钱,是因为这门手艺有门槛、要时间、得天赋。稀缺,是定价的唯一来源。
而 AI 干的事,本质上只有一件:它在系统性地、不知疲倦地、以趋零的成本,消灭稀缺。
它抹平了写代码的门槛——于是会写代码不再稀缺。它抹平了做设计的门槛——于是会做设计不再稀缺。它抹平了剪视频、写文案、画插画、搭网站的所有门槛——于是这一切,统统不再稀缺。一个人,一个下午,就能生成一个 App;一个人,一天,就能产出一部看起来相当精致的短片。
听起来像是生产力的解放,是个人能量的空前爆发。可它不是富足,它是拥挤。 是赛道上前所未有的、密不透风的拥挤。
因为供给这一侧,被 AI 推向了无限。人人都是一支军队,人人都是一条产线,内容、代码、设计、应用,像决堤的洪水一样涌出来。
可需求那一侧呢?需求是死死有限的。人类总体的注意力是有限的——一天就 24 小时,眼睛就一双。人类的钱包是有限的——能为内容付的钱,就那么多。人的生命是有限的——满打满算三万天,能消费的东西就那么些。
无限的供给,撞上有限的需求,物理上只有一个结果:价值的自由落体。
每一个能一小时生成一个 App 的人,都在亲手让"会做 App"这件事贬值。每一个能一天剪出精致视频的人,都在亲手让"会剪视频"这件事贬值。你越高产,你产出的东西就越不值钱;你越高效,你这个工种的定价就越往下掉。这是一场所有人都在拼命踩油门、却集体冲向悬崖的狂欢。
所以,那句被重复了三年的承诺——"AI 会把你从重复劳动里解放出来"——它真正的下半句,从来没人敢念出来:
AI 没有解放劳动者。它只是解除了劳动者讨价还价的资格。
因为"反正不需要你了",因为"这活 AI 一秒钟就干了",因为"你会的,现在人人都会"。当你赖以为生的那点稀缺性被技术抹平,你就失去了和资本谈判的全部筹码。你的工资不再由你的价值决定,而由"替代你的成本"决定——而那个成本,正在以每年 60% 到 70% 的速度,奔向零。
现在,回到中美那条分界线,你会看见两种过剩,两种死法。
北美的过剩,是少数人的过剩。 因为智能是奢侈品,门票贵,真正能大规模烧 token 搞生产的,是那些付得起账的巨头和精英。普通人被高昂的入场费挡在外面,过剩被锁在金字塔尖那一小撮人手里。泡沫因此还能维持一阵体面——壁垒高,挤进来的人少,价值的崩塌是局部的、缓慢的。
中国的过剩,是所有人的过剩。 因为智能是基础设施,门票降到了零,于是人人入场,人人开足马力,人人都在生产那个早已不值钱的东西。这才是白菜价智能真正的诅咒——它没有把内卷消灭,它把内卷的入场券,从"有门槛"变成了"零门槛"。
从前的内卷,是"你卷不过那些比你更强的人",至少还有个"变强"的出口,还有个往上爬的指望。现在的内卷,是"你卷不过工具"——因为工具不要工资、不会累、24 小时连轴转;同时你也"卷不过那个和你握着同一把免费工具的所有人"——因为大家手里的刀一模一样,都是那把趋近免费的刀,谁都没有了优势,谁也杀不出重围。
白菜价的智能,喂出来的从来不是富足。它喂出的,是一片谁都赢不了、谁也逃不掉的红海。 海水是免费的,所以人人都跳了进来;也正因为免费,没有人能靠它上岸。
终局:两条路,同一个深渊
那么,2026 年的结局,会是什么?
结局其实已经写在墙上,只是字迹太淡,大多数人不愿凑近去读。
哪怕 token 在大洋彼岸贵得离谱,哪怕英伟达的副总裁亲口承认养不起,大厂们也绝不会停下脚步。因为这是一场叙事的军备竞赛——你一旦停下,资本市场就会判你出局,认定你"掉队了""不懂 AI 了""要被时代抛弃了"。于是它们只能咬着牙,含着泪,继续推进高强度的数字化转型,继续烧那个明知道短期回不了本的钱。
代价是什么?是人。今年,全行业大概率会迎来一轮结构性的清洗——这是一个判断,不是一个被官方确认的数据,但你翻开任何一家大厂的财报、读任何一份 CFO 的措辞,都能闻到那股山雨欲来的味道。被裁掉的人,一部分是为了"降本",去填那个被 AI 撑大的预算窟窿;另一部分,则纯粹是因为他们会的那件事,AI 现在也会了,而且更便宜。
企业,则在这场清洗里,裂成了两极:
一极,是免役者。 英伟达、AMD 这样卖铲子的人,站在产业链上游,从不承担下游那个无底洞般的 token 消耗,旱涝保收,稳赚不赔。淘金的人死多少,跟卖铲子的没关系,铲子照样按高价出货。它们是这场战争里唯一不流血的人。
另一极,是泥潭里的人。 那些应用层的公司,被死死困在一句话里:买不起 AI,又杀不死 AI。不上 AI,会被叙事淘汰,被对手碾过;上了 AI,又被账单拖垮,被成本反噬。它们前进是悬崖,后退是火海,只能在中间那片越来越窄的泥潭里,一点一点地下沉。
而中国,会走出第三条路——也是最锋利、最反直觉的一条:
它不会被 AI 的账单压垮。它会被 AI 的廉价淹没。
这边没有"用不起"的奢侈烦恼。这边的烦恼是反过来的——"人人都用得起,于是人人都不值钱"。这是一种没有 dramatic 的破产、没有 CFO 脑袋炸裂的时刻、没有内部信和卸载倒计时的死法。它安静得多,也彻底得多:不是被一记重拳打倒,而是被齐腰深、然后齐胸深、然后没顶的温水,慢慢淹没。一个集体性的、无声的、连挣扎都显得多余的沉没。
你看,两条路,看起来截然相反:
一边是奢侈品砸出来的黑洞,一边是基础设施漫上来的红海。 一边死于太贵,贵到连巨头都要裁人来喂它;一边死于太贱,贱到所有人都用得起、于是所有人都被它埋了进去。
可这两条看似相反的路,最终通向的,是同一个尽头:
一个生产力严重过剩、消费力严重萎缩、而劳动者既不被需要、也不被定价的世界。 在那个世界里,机器什么都能造,可没人买得起;智能无处不在,可没人因它而值钱;东西多到溢出来,人却空前地多余。
结语:神话的两种结清方式
这从来不只是一场技术成本的阵痛。这是一次理性的反噬,是人类用自己最高的智慧,给自己挖的一个最深的坑。
我们造出了一种智能。它高频到、庞大到、贪婪到——它消耗的资源,开始超过它本想替代的那条人命。我们本想用一台机器换下一个人,却发现这台机器吃得比那个人贵得多,也吃得比那个人多得多。
在大洋的这一岸,它贵得连卖铲子的巨头都用不起,于是人们裁掉同类,腾出预算,去喂它。 在大洋的那一岸,它廉价得像呼吸的空气,于是人人都贪婪地吸着它,然后一起,窒息在那片由过剩堆成的、谁也游不出去的海里。
一边是奢侈品的黑洞,一边是基础设施的红海。一边死于太贵,一边死于太贱。一边是少数人的盛宴,一边是所有人的沉没。
2026 年,也许正是 AGI 这则宏大神话,从"创世传说"坠入"严酷精算"的那道分水岭。在这一年之前,AI 是关于未来的诗;在这一年之后,AI 是关于账单的算术。
而神话从来不会被它的对手戳破。神话,只会被它自己,悄悄地、体面地,结清。
——在大洋的一岸,被自己的账单结清。 ——在大洋的另一岸,被自己的白菜价,淹没。
断裂,从来不是终点。断裂,只是让你第一次看清,那座你一直以为坚不可摧的桥,原来是用什么搭起来的。