第一線 AI 團隊不等更強的模型,他們在做另一件事

更新 發佈閱讀 4 分鐘

上篇講了 Anthropic 整批員工的 craft 哲學,和 PM 改寫 evals 的工作轉變。這篇繼續後三件事:工具組合、世代授權、以及跨週期的隱形 leverage。

第三件:不等更強的模型,先把工具堆起來

每次新模型出來,社群上有兩種反應。一種人說「終於可以做 X 了」,另一種說「還是不行」。看起來不同,其實都在等。等模型變強。

但我翻了一圈發現,第一線的團隊沒有人在等。

Google DeepMind 的官方文件有個概念叫 scaffolding(鷹架):不是讓單一模型扛所有事,而是在模型周圍堆工具,查資料的查資料、驗邏輯的驗邏輯、格式不對就重跑。與其等到 AI 強到不會出錯,不如在它旁邊放一些檢查機制,讓它出錯時能被攔下來。

中國的月之暗面(Kimi)做得更激進:可以把一個任務拆成 300 個 sub-agents 同時跑,端到端延遲降 80%。Anthropic 工程師 Boris Cherny 講過他同時跑 5 個 agents,有時候他們互相吵架,但都在替他幹活。

這在工程上是奇觀,但它說的其實是工作的形狀變了。

過去一個工作流要一個人從頭做到尾:寫週報的人查數據、整理重點、寫文字、修錯字,全部一個人扛。現在一個工作流可以由多個 agent 分工,人類只在關鍵節點介入。就像上班組團隊也不可能個個是明星成員,能截長補短、互相分工才是重點。

對非工程師的啟示很簡單:不是找一個全能助理幫你做完所有事,是設計一條分工流水線。每個環節讓 AI 做一件小事,合起來的成品比你叫它「直接給我完整報告」好很多。

第四件:原生 AI 世代的年輕人,比你想像中值得信任

我們老一輩總擔心年輕人有 AI 之後懶得用大腦。但我翻這 8 家公司的時候,看到的不是這件事。

DeepSeek 全公司約 140 人,以年輕研究員為主力。梁文鋒說,每個人隨時可以無審批調用訓練集群的 GPU,一張 GPU 一個月幾千美金。字節 Seed 的實習生,掛名核心基礎設施的開發。在傳統大廠,實習生通常只做邊緣專案,不可能碰核心。

這些公司在做的是:把核心資源開放給年輕人,用結果驗證信任,不用資歷篩選。

這件事對兩種人有不同的意義。

如果你是主管,你的猶豫通常不是「他做不到」,是「他做不到的時候我兜不住」。但 AI 時代的年輕人是用工具放大現有判斷力,天花板跟過去十年累積經驗的人不一樣了。

如果你是被觀察的年輕人:能不能讓主管覺得「給你授權的成本是合理的」,跟你的工作方法寫得多清楚有直接關係。能寫清楚的人,主管才放心放手。

跨週期的隱形 leverage

我這代前 AI 時代長大的職場人,看過 PC、互聯網、行動網路三個週期的工作流怎麼被重組、誰賭錯了、誰賭對了。這個跨週期記憶本身就是判斷力,是原生 AI 世代沒有的東西。

但它要能被用上,前提是你得先進到協作模式,不能一直停在 chat 模式當消費者。

chat 模式是「我問,AI 答」。協作模式是「我設計任務,AI 執行,我驗收標準」。這兩件事用的是同一個工具,但工作者的位置不一樣。

寫了這麼多,其實是同一件事的不同層次:把判斷力變成資產是 Why,把標準寫成可打勾的 evals 是 How,用工具堆疊讓標準跑起來是 What。三件事連在一起,才是一個完整的動作。


📌 本文首發於「許幼如|用數據拆解商業世界」,完整版請見: https://yojuhsu.com/blog/ai-non-engineer-work-reorganize

✉️ 訂閱電子報: https://yojuhsu.beehiiv.com/

留言
avatar-img
許幼如|一個人的讀書會
2會員
20內容數
生活裡到處都是商業模型。我拆開來給你看
2026/05/10
前兩個月我看到 Anthropic 設計主管 Jenny Wen 講「設計流程死了」(the design process is dead)的時候,我第一個反應是好奇:為什麼要講這麼引起爭議的話? 每次 AI 有新發展,外行人開開心心地說:我們不再需要設計師了。總是馬上引起設計圈內人的反擊。現在居
Thumbnail
2026/05/10
前兩個月我看到 Anthropic 設計主管 Jenny Wen 講「設計流程死了」(the design process is dead)的時候,我第一個反應是好奇:為什麼要講這麼引起爭議的話? 每次 AI 有新發展,外行人開開心心地說:我們不再需要設計師了。總是馬上引起設計圈內人的反擊。現在居
Thumbnail
2026/04/06
前言 2026 年 4 月初,Andrej Karpathy 在 X 上發了一篇「LLM Knowledge Bases」,描述怎麼用 AI 把原始素材編譯成一座個人知識 wiki。學習圈大熱,很多朋友來問我有沒有這樣做。 老實說我沒仔細去讀 Karpathy 的原文。但這件事我本來就介在想做跟
Thumbnail
2026/04/06
前言 2026 年 4 月初,Andrej Karpathy 在 X 上發了一篇「LLM Knowledge Bases」,描述怎麼用 AI 把原始素材編譯成一座個人知識 wiki。學習圈大熱,很多朋友來問我有沒有這樣做。 老實說我沒仔細去讀 Karpathy 的原文。但這件事我本來就介在想做跟
Thumbnail
2026/04/06
每年二月,巴塞隆納會上演同一齣戲。 全球最大的電信展MWC(世界行動通訊大會)開幕,執行長們走上舞台,用同樣確定的語氣告訴你:「這次不一樣。這個技術將會改變一切。」 2016年說的是5G。2019年說的是智慧連接時代。2022年說的是元宇宙。2024年說的是AI重塑電信。 然後現實來了。 5
Thumbnail
2026/04/06
每年二月,巴塞隆納會上演同一齣戲。 全球最大的電信展MWC(世界行動通訊大會)開幕,執行長們走上舞台,用同樣確定的語氣告訴你:「這次不一樣。這個技術將會改變一切。」 2016年說的是5G。2019年說的是智慧連接時代。2022年說的是元宇宙。2024年說的是AI重塑電信。 然後現實來了。 5
Thumbnail
看更多
你可能也想看
Thumbnail
過去幾個月參加不少產品經理活動,發現 AI 時代下將產品團隊切成兩種類型 (1) AI 焦慮的團隊急迫地擁抱 AI,PM 和 RD 全面導入 AI 工具、(2) AI 無感的團隊有導入 AI,但偏向個人使用。兩種角色的情況不同:全面導入 AI 的團隊:「AI 工具更新太快了,下周又有新的模型
Thumbnail
過去幾個月參加不少產品經理活動,發現 AI 時代下將產品團隊切成兩種類型 (1) AI 焦慮的團隊急迫地擁抱 AI,PM 和 RD 全面導入 AI 工具、(2) AI 無感的團隊有導入 AI,但偏向個人使用。兩種角色的情況不同:全面導入 AI 的團隊:「AI 工具更新太快了,下周又有新的模型
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
Thumbnail
為什麼要做 DB LOG REVIEW 實務上,只要資料涉及高密級或個人資料,即使欄位本身已採用加密措施,仍必須被納入查核範圍。加密只是降低外洩風險的防護手段,並不等同於去識別化,因此不能因為「資料看不到明碼」就降低查核標準。這類資料的存取紀錄,至少需定期被完整檢視,才能符合內控與資安的基本要求。
Thumbnail
為什麼要做 DB LOG REVIEW 實務上,只要資料涉及高密級或個人資料,即使欄位本身已採用加密措施,仍必須被納入查核範圍。加密只是降低外洩風險的防護手段,並不等同於去識別化,因此不能因為「資料看不到明碼」就降低查核標準。這類資料的存取紀錄,至少需定期被完整檢視,才能符合內控與資安的基本要求。
Thumbnail
想讓 AI 幫您管理專案?了解如何用 AI 甘特圖自動更新排程、預測風險。本文評比 ClickUp、monday 與 Asana,為您找到解放生產力的最佳工具。
Thumbnail
想讓 AI 幫您管理專案?了解如何用 AI 甘特圖自動更新排程、預測風險。本文評比 ClickUp、monday 與 Asana,為您找到解放生產力的最佳工具。
Thumbnail
台大李宏毅教授的 AI Agent 影片讓我重新審視 PM 的工作清單。 語言模型是文字接龍,Agent 是讓它長出手腳自己執行任務。競品追蹤、會議整理、進度提醒可以外包;用戶訪談、跨部門溝通、優先序決策非人不可。Agent 省下的時間,你打算放在哪裡?
Thumbnail
台大李宏毅教授的 AI Agent 影片讓我重新審視 PM 的工作清單。 語言模型是文字接龍,Agent 是讓它長出手腳自己執行任務。競品追蹤、會議整理、進度提醒可以外包;用戶訪談、跨部門溝通、優先序決策非人不可。Agent 省下的時間,你打算放在哪裡?
Thumbnail
本文分享如何在3小時內,將碎裂的錄音與對話轉化為商業級 MVP,並指出,AI 時代的競爭力不在於指令多寡,而在於 PM 的「審美」與「邏輯分層」能力。作者提出「人機成本(All-in Cost)」新思維:優化指令以節省算力(Token),將 PM 從溝通耗損中解放,進化為精準調度算力與決策的指揮官。
Thumbnail
本文分享如何在3小時內,將碎裂的錄音與對話轉化為商業級 MVP,並指出,AI 時代的競爭力不在於指令多寡,而在於 PM 的「審美」與「邏輯分層」能力。作者提出「人機成本(All-in Cost)」新思維:優化指令以節省算力(Token),將 PM 從溝通耗損中解放,進化為精準調度算力與決策的指揮官。
Thumbnail
本篇紀錄了一位 PM 如何在資源受限下,運用 AI 工具協助打造電商「新客推薦引擎」的實戰過程。包含:問題重構:如何透過 AI 協助 Brainstorming,與 AI 協作低程式碼實作:讓 AI 產出 Python 程式碼進行推薦權重計算,最後是驗證與迭代的重要性。
Thumbnail
本篇紀錄了一位 PM 如何在資源受限下,運用 AI 工具協助打造電商「新客推薦引擎」的實戰過程。包含:問題重構:如何透過 AI 協助 Brainstorming,與 AI 協作低程式碼實作:讓 AI 產出 Python 程式碼進行推薦權重計算,最後是驗證與迭代的重要性。
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
Thumbnail
AI 時代的浪潮席捲而來,無數的 AI 工具如雨後春筍般湧現,也帶來了瀰漫在職場中的集體焦慮。常常會想:當 AI 能做的事情越來越多,PM 的價值還剩下什麼?這次剛好有機會我參加了一場線上論壇:[TWPG 線上論壇] AI 時代的產品經理:挑戰 × 轉型 × 新機會,期望能從他人的經驗中,找到運用
Thumbnail
AI 時代的浪潮席捲而來,無數的 AI 工具如雨後春筍般湧現,也帶來了瀰漫在職場中的集體焦慮。常常會想:當 AI 能做的事情越來越多,PM 的價值還剩下什麼?這次剛好有機會我參加了一場線上論壇:[TWPG 線上論壇] AI 時代的產品經理:挑戰 × 轉型 × 新機會,期望能從他人的經驗中,找到運用
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
PM、SA 與 RD 常面臨接手遺留系統或無文件功能的狀況。當缺乏產品需求文件 (PRD) 時,唯一的真相來源只剩下程式碼。手動追蹤龐大專案中的跨檔案調用、資料流向與條件判斷極度耗時。直接檢視原始碼雖然準確,但對於非原開發者而言,理解並重新結構化當中的業務邏輯是一項成本極高的工作。
Thumbnail
PM、SA 與 RD 常面臨接手遺留系統或無文件功能的狀況。當缺乏產品需求文件 (PRD) 時,唯一的真相來源只剩下程式碼。手動追蹤龐大專案中的跨檔案調用、資料流向與條件判斷極度耗時。直接檢視原始碼雖然準確,但對於非原開發者而言,理解並重新結構化當中的業務邏輯是一項成本極高的工作。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News