上篇講了 Anthropic 整批員工的 craft 哲學,和 PM 改寫 evals 的工作轉變。這篇繼續後三件事:工具組合、世代授權、以及跨週期的隱形 leverage。
第三件:不等更強的模型,先把工具堆起來
每次新模型出來,社群上有兩種反應。一種人說「終於可以做 X 了」,另一種說「還是不行」。看起來不同,其實都在等。等模型變強。
但我翻了一圈發現,第一線的團隊沒有人在等。
Google DeepMind 的官方文件有個概念叫 scaffolding(鷹架):不是讓單一模型扛所有事,而是在模型周圍堆工具,查資料的查資料、驗邏輯的驗邏輯、格式不對就重跑。與其等到 AI 強到不會出錯,不如在它旁邊放一些檢查機制,讓它出錯時能被攔下來。
中國的月之暗面(Kimi)做得更激進:可以把一個任務拆成 300 個 sub-agents 同時跑,端到端延遲降 80%。Anthropic 工程師 Boris Cherny 講過他同時跑 5 個 agents,有時候他們互相吵架,但都在替他幹活。
這在工程上是奇觀,但它說的其實是工作的形狀變了。
過去一個工作流要一個人從頭做到尾:寫週報的人查數據、整理重點、寫文字、修錯字,全部一個人扛。現在一個工作流可以由多個 agent 分工,人類只在關鍵節點介入。就像上班組團隊也不可能個個是明星成員,能截長補短、互相分工才是重點。
對非工程師的啟示很簡單:不是找一個全能助理幫你做完所有事,是設計一條分工流水線。每個環節讓 AI 做一件小事,合起來的成品比你叫它「直接給我完整報告」好很多。
第四件:原生 AI 世代的年輕人,比你想像中值得信任
我們老一輩總擔心年輕人有 AI 之後懶得用大腦。但我翻這 8 家公司的時候,看到的不是這件事。
DeepSeek 全公司約 140 人,以年輕研究員為主力。梁文鋒說,每個人隨時可以無審批調用訓練集群的 GPU,一張 GPU 一個月幾千美金。字節 Seed 的實習生,掛名核心基礎設施的開發。在傳統大廠,實習生通常只做邊緣專案,不可能碰核心。
這些公司在做的是:把核心資源開放給年輕人,用結果驗證信任,不用資歷篩選。
這件事對兩種人有不同的意義。
如果你是主管,你的猶豫通常不是「他做不到」,是「他做不到的時候我兜不住」。但 AI 時代的年輕人是用工具放大現有判斷力,天花板跟過去十年累積經驗的人不一樣了。
如果你是被觀察的年輕人:能不能讓主管覺得「給你授權的成本是合理的」,跟你的工作方法寫得多清楚有直接關係。能寫清楚的人,主管才放心放手。
跨週期的隱形 leverage
我這代前 AI 時代長大的職場人,看過 PC、互聯網、行動網路三個週期的工作流怎麼被重組、誰賭錯了、誰賭對了。這個跨週期記憶本身就是判斷力,是原生 AI 世代沒有的東西。
但它要能被用上,前提是你得先進到協作模式,不能一直停在 chat 模式當消費者。
chat 模式是「我問,AI 答」。協作模式是「我設計任務,AI 執行,我驗收標準」。這兩件事用的是同一個工具,但工作者的位置不一樣。
寫了這麼多,其實是同一件事的不同層次:把判斷力變成資產是 Why,把標準寫成可打勾的 evals 是 How,用工具堆疊讓標準跑起來是 What。三件事連在一起,才是一個完整的動作。
📌 本文首發於「許幼如|用數據拆解商業世界」,完整版請見: https://yojuhsu.com/blog/ai-non-engineer-work-reorganize
✉️ 訂閱電子報: https://yojuhsu.beehiiv.com/























