當Token變成勞動力,人就變成了介面

By: blockbeats|2026/03/24 13:00:07
0
分享
copy
文 | 林晚晚

1876 年,費城世博會。巴西皇帝佩德羅二世拿起貝爾發明的電話,聽到另一頭傳來的聲音,驚呼:「天哪,它會說話!」

一百五十年後,2026 年 3 月 18 號,聖荷西會議中心。穿黑色皮夾克的黃仁勳站在 GTC 大會的舞台上,也說了一句讓人驚的話。

「十年後,NVIDIA 大概有 7.5 萬名員工。他們會非常非常忙,因為要和 750 萬個 AI agent 一起工作。」

臺下笑了。

7.5 萬人,750 萬個 agent,1:100。

黃仁勳自己也笑了,補了一句:「它們會全天候工作。希望我們的人不用跟它們比。」

當Token變成勞動力,人就變成了介面

掌聲散了,這個數字被當天更花俏的晶片發布和合作協議淹沒了。但我們再把它單獨拎出來想一會兒,這有可能是整場大會最重要的一句話之一。

不止有黃仁勳。三個月前,另一個人把同一種未來描述得更具體。

2026 年 1 月,拉斯維加斯 CES。麥肯錫 CEO Bob Sternfels 坐在臺上報數字。

「我們現在有 4 萬名人類員工,大約 2.5 萬個 AI agent。」不到兩年前,這個數字還是幾千。那 2.5 萬個 agent 過去半年生成了 250 萬張圖表。

250 萬張圖表。過去這活兒是剛入職的分析師幹的。二十三四歲,頂著世界名校光環,凌晨三點對齊坐標軸。

那是每一個麥肯錫新人的起點,用最機械的勞動換一張通往合夥人之路的門票。

如今這張門票的前半段被 agent 接管了。Sternfels 說:AI 讓某些崗位增長了 25%,也讓另一些崗位縮減了 25%。公司被整整齊齊地劈成兩半,擴張的一半和收縮的一半。

NVIDIA 的故事和麥肯錫的故事講的是同一件事。

1:100 的世界裡,幹活的是 Token 驅動的 agent,人是連接在 agent 上面的接口。

外掛的遙控器不在你手裡

GTC 那一周,黃仁勳做客 All-In Podcast,說了一句殺傷力更大的話。

「假設你有一個年薪 50 萬美元的工程師。如果他沒有消耗至少 25 萬美元的 Token,我會非常擔憂。」

主持人追問 NVIDIA 是否在為工程團隊花 20 億美元買 Token,黃仁勳答:「我們正在努力。」

一個不燒 Token 的工程師,50 萬也不值 50 萬。

NVIDIA 的方案很直接,往薪酬包裡塞 Token。黃仁勳在 GTC 主題演講上說,未來 NVIDIA 每個工程師都會有一筆年度 Token 預算,大約是基本工資的一半。

一個 base 幾十萬美元的工程師,額外拿到相當於半個 base 的推理算力配給,總包裡三分之一是純粹的燃料。

一個拿滿額 Token 預算的人,等於全天候有十幾個 AI agent 幫他寫程式碼、跑測試、搜文獻、做仿真。一個只有免費版 API 額度的人,還在靠雙手敲鍵盤。兩個人簡歷可能一模一樣,產出差 5 到 10 倍。

這在矽谷已經不是理論了。

今年 3 月,Business Insider 報導了一個變化:工程師面試時開始問「這個岗位配多少 Token 預算?」Theory Ventures 的合夥人 Tomasz Tunguz 把 Token 預算叫工程師薪酬的「第四支柱」,排在底薪、獎金、股權後面。OpenAI 總裁 Greg Brockman 的話更直接:你能調用多少推理算力,將越來越決定你的整體生產力。

黃仁勳在 GTC 演講裡自己也說了:「有多少 Token 跟著我的岗位走?這已經是矽谷的招聘工具了。」

1950 年代,底特律汽車工人的工資在全美名列前茅。真正讓他們過上中產生活的,是亨利·福特發明的流水線。工人站在線上,線動人不動,每個人的產出被機械臂放大了幾十倍。一個底特律工人的生活水準遠超同期的手工匠人,手藝未必更好,但他腳下踩的是一條更粗的流水線。

2026年的 Token 預算,就是 1950年的流水線。

但有一個區別。

底特律工人離開福特,可以去通用,可以去克萊斯勒,流水線哪兒都有。工會能跟資方談判,要求更好的線速和更安全的環境。

Token 預算不一樣。公司給你那天你是超人,收回那天你變回路人。股票能套現帶走,技能能跟著你跳槽。Token 預算什麼都不是,就是外掛,開關在公司手裡。

硅谷已經有了一個新詞來形容這種處境,叫「GPU 飢渴」。

頂級 AI 研究員跳槽,薪資差距已經排到第二位了,排第一的是算力。跑不了實驗,部署不了 agent,能力被配額卡死。「你們給多少 Token」有時候排在股票前面。股票是一張可能跌的遠期支票,Token 預算是今天就能兌現的生產力。

而不用 AI 的人,直接出局。

Goldman Sachs 估算 AI 可能自動化美國 25% 的工時。Mercer 調查說 65% 的高管預期兩到三成的員工會因 AI 被重新配置。兩組數字疊在一起,結論很清楚:有 Token 的人產出爆炸,沒有 Token 的人被優化掉。

分界線是 Token 配額,和人的能力,關係越來越小。

Token 吞吐量就是估值

個人的價值由 Token 配額決定。公司呢?

2026年3月初,一家叫 MiniMax 的上海公司發了上市以來的第一份年報。全年營收 7900 萬美元,調整後淨虧損 2.5 億 2.5 億。按傳統財務指標看,這是一家燒錢的小公司,營收只有 Accenture 一個季度的零頭。

但資本市場不這麼看它。

MiniMax 的 CEO 閻俊傑在財報電話會上說了一句話,比整份財報都重要:「公司的價值,由智能密度乘以 Token 吞吐量決定。」

Token 吞吐量,不是營收增速,不是用戶數,不是毛利率。

支撐這句話的資料很硬。2026 年 2 月,MiniMax 的 M2 系列模型日均 Token 消耗量,比兩個月前的 12 月漲了 6 倍。編程場景的 Token 消耗漲了 10 倍。在 AI 模型聚合平台 OpenRouter 上,MiniMax 的 M2.5 兩周消耗了 4.55 兆 Token,把美國的模型全部擠下去,一家上海公司第一次登上全球 Token 消耗排行榜的榜首。

《南華早報》報導這件事時用了一個說法:中國的開源模型終結了美國開發者長達一年的市場統治。終結靠的是什麼?Token 消耗量。誰的 Token 被燒得最多,誰就是贏家。

這個邏輯放到 OpenAI 身上也成立。OpenAI 的 API 平台每分鐘處理 60 億 Token,兩年漲了 20 倍。年消費超過 10 萬美元的企業客戶,一年翻了將近 7 倍。Barclays 分析師 Ross Sandler 拆了一遍資料後得出結論:OpenAI 在消費端的 Token 消耗量是 Google Gemini 的兩倍以上。

Token 消耗量,成了給 AI 公司排座次的硬通貨。

更有意思的是這件事在公司內部的樣子。紐約時報最近報導了一個叫「tokenmaxxing」的現象:Meta 和 OpenAI 的工程師在內部排行榜上比拼誰消耗的 Token 多。

Token 預算正在變成標準福利,就像十年前的免費午餐和牙科保險。一個在愛立信斯德哥爾摩辦公室工作的工程師告訴紐約時報,他花在 Claude 上的錢可能比他薪水還高,但公司買單。

TechCrunch 上週的一篇文章算了一筆賬:一個工程師下午寫篇文章可能用掉 1 萬 Token,但一個跑著 agent 集群的工程師,一天能在後台燒掉幾百萬 Token,一個字都不用打。

兩年前,每百萬 Token 的價格是 33 美元。現在,9 美分。跌了 99.7%。價格越便宜,燒得越猛。燒得越猛,越離不開。

閻俊傑在電話會上的預測是:未來市場對 Token 的需求,可能會增長一到兩個數量級。

這就是 2026 年給一家公司定價的新方式。不看你賺了多少錢,看你的 Token 被燒了多少。MiniMax 虧 2.5 億,但 Token 吞吐量的增長曲線陡得嚇人,資本市場願意下注。你可以把它類比成 2006 年的 YouTube,一毛錢收入沒有,但帶寬消耗量在指數增長,Google 願意花 16.5 億買它。

當年 YouTube 燒的是帶寬。今天 MiniMax 燒的是 Token。計量單位變了,邏輯沒變。

產能等得起,債務等不起

GTC 同一周還發生了一件事。

3 月 18 號,Stripe 發布了 Machine Payments Protocol。說白了:AI agent 可以自己花錢了。

一個 agent 需要一組數據,自己付費下載。需要算力跑推理,自己按秒買。需要調用另一個 agent 的 API,自己結賬。整個過程不需要人類點確認。Visa 為這個協議適配了信用卡支付,Coinbase 做了 agent 專屬錢包,Mastercard 在開發 Agent Pay。

Token 的消耗從此多了一個來源。過去只有「人調度 agent」這一種場景。現在 agent 自己也在消耗 Token,而且在用 Token 賺來的錢去買更多 Token。Stripe 聯合創始人 John Collison 用了一個詞:洪流。

黃仁勳在臺上給了對應的數字:NVIDIA 要把 Token 生成速率從 2200 萬拉到 7 億,350 倍。

這是在建一整張公路網,賭車流量會指數增長。

6000 億美元的基建賭注,需要一個前提:全世界對 Token 的消耗量,要大到能撐起回本。這個前提目前還只是一個假設,而且是一個非常昂貴的假設。

2025 年最後一個季度,科技公司發行了創紀錄的 1087 億美元債券。進入 2026 年,頭幾周又是 1000 億。Morgan Stanley 和 JPMorgan 預估未來幾年 AI 相關企業借債總量可能達到 1.5 萬億美元。據 Goldman Sachs 估算,AI 資本開支已經占到美國 GDP 的 3% 左右。

华尔街最先嗅到风险的一批人已经开始买保险了。信用违约互换的交易量在升。花几十個基點的保費,賭的是這些公司可能還不上錢。Citi 的信用策略主管 Daniel Sorid 在一次投資人會議上說了一句:「作為信用投資者,面對這種規模的轉型,需要這麼大的資本投入,讓人本能地感到不安。」

Google 創始人 Larry Page 在公司內部說過一句更極端的話,Page 多次對 Google 員工說:「我寧願破產也不願輸掉這場競賽。」

它精確地描述了一個囚徒困境:每一家巨頭都在賭對手會繼續投入,所以自己不能停。停下來的人直接出局。

樂觀的一面有硬數據。Token 生成速率拉高 350 倍。Stripe 剛讓 agent 自己花錢。McKinsey 兩年內從幾千個 agent 擴到 2.5 萬個。如果 agent 經濟全面起飛,Token 消耗的增長曲線確實可能拐成指數級。

但有一個日期讓很多人睡不好覺。2026 年下半年,續約懸崖。

2024 到 2025 年,企業花的是「創新預算」。CEO 需要在財報會上說一句「我們在擁抱 AI」,價格不太敏感,效果不太苛求,花的是姿態的錢。2026 年下半年,第一批試點項目到續約節點。創新預算花完了,CTO 讓出了桌子對面的位置,CFO 坐了過來。CFO 只認一個數字:ROI。

如果大量試點被砍,Token 的終端消耗會突然出現缺口。上游 6000 億砸出來的產能,數據中心建好了,電力接通了,晶片上架了,變成閒置產能。

這種事歷史上發生過。

2000 年,電信公司花萬億美元鋪海底光纜。泡沫破裂,全球 90% 的光纜暗在海底,閒了將近十年。直到 Netflix 開始流媒體、iPhone 引爆移動互聯網,光纜才被一根一根點亮。光纜沒白鋪。鋪光纜的朗訊、北電、世通都破產了。基礎設施還在,建設者不在了。

2012 年,中國光伏。無錫尚德、江西賽維把組件價格打穿全球成本線。產能嚴重過剩,行業血洗三年。需求後來確實來了,光伏今天是地球上增長最快的能源。尚德破產了。賽維破產了。先行者躺在了黎明前最後一段黑暗裡。

贝爾發明電話後,Western Union 拒絕以 10 萬美元買下專利。十年後 Western Union 願意出 2500 萬美元,貝爾不賣了。三十年後電話網路覆蓋了全美國。但鋪網路的那些小公司,大多沒活到電話普及的那一天。贏家是後來靠收購和壟斷吃下一切的 AT&T。

基礎設施的故事永遠是這個版本。方向幾乎總是對的,但時間差會殺人。

回到 Token。前面講的那個結構,Token 變成勞動力,人變成接口,Token 額度定義一切,成立的前提是 Token 被持續、大量、加速地消耗。工程師的 10 倍產出靠 Token 供給撐著,砍掉就歸零。OpenAI 的 8400 億估值靠算力承諾撐著,協議終止就縮水。6000 億的基建靠終端消耗增長撐著,增速一放緩就是空轉。

每一層依賴下一層。消耗增速比建設增速慢兩三年,整條鏈上所有人的定價都會鬆動。

-- 價格

--

你靠著哪條鐵路

2023 年有卡就是爹。2026 年有 Token 就是爹。

聽起來像換了個詞,底下的變化比大多數人意識到的要深。

GPU 是資產,買到了就是你的,鎖在機房裡,別人拿不走。

Token 是流量。你的 10 倍產出、你的高估值、你在談判桌上的籌碼,全部建立在一股持續的、不屬於你的供給上。水龍頭一關,一切歸零。

當 Token 變成真正幹活的勞動力,人就變成了接在 Token 上面的接口。好的接口能讓 Token 發揮更大價值,判斷力、審美、經驗,這些東西還在。但一個接口能做多少事,首先取決於它被接入了多少 Token。

1870 年代的美國農民發現,種出好小麥還不夠,得在鐵路邊上。1950 年代的手工匠人發現,手藝再好也拼不過流水線上的工人。2026 年的工程師正在發現,程式碼寫得再漂亮,沒有 Token 預算,一切都是空轉。

當 Token 變成真正的勞動力,人就變成了接口。接口本身的好壞還重要,但接口值多少錢,首先取決於誰在給它供電。

猜你喜歡

熱門幣種

最新加密貨幣要聞

閱讀更多