📝📝：導入 AI 後，反而感覺比以前更忙｜史丹佛研究員：AI 運行的環境和任務過於「無菌」

鋼哥

2025/08/29 更新2025/08/29 發佈閱讀 7 分鐘

Christopher Gower on Unsplash

AI 運行的環境和執行的任務都過於「無菌」，與現實世界有一定的差落差。

本篇參考自史丹佛大學的研究員 Yegor Denisov-Blanch 的研究成果，完整演講也已公布《Does AI Actually Boost Developer Productivity?》

史丹佛大學的研究員 Yegor Denisov-Blanch 在過去三年中展開了規模龐大的研究，針對超過 600 間公司、逾 10 萬名軟體工程師、數千萬次程式提交（commits）、以及數十億行程式碼進行分析。

Denisov-Blanch 發現，目前業界所宣稱 AI 能帶來的「生產力榮景」，其實過於誇大也同時忽略了背後的隱藏成本。更重要的是，AI 運行的環境和執行的任務都過於「無菌」，與現實世界有一定的差落差。

生產力的迷思

關於 AI 如何影響開發者生產力的現有研究，大多存在三個關鍵性限制，嚴重削弱了這些研究在真實世界中的可靠性與適用性。

衡量指標的錯誤

許多研究將提交次數（commits）、pull requests 或完成的任務數視為生產力指標，假設「更多的活動」就等於「更高的生產力」。然而，這種方法根本誤解了軟體開發工作的本質。

不同任務的複雜程度差異極大，提交次數增加並不必然意味著真正的效率提升。Stanford 的研究甚至揭示了一個令人憂慮的現象：

AI 經常產生額外任務，因為它本身先寫出有缺陷的程式碼，隨後又需要人類開發者進行修補。

結果導致開發者看似更忙碌，實際上卻在無效循環中打轉。

研究設計的人工化

大多數受控實驗會將開發者分成兩組，一組使用 AI 工具，另一組則不使用，然後要求雙方完成「greenfield」任務：從零開始開發全新專案、完全沒有既有上下文。在這類情境中，AI 確實經常表現優於純人類方法。

但問題在於，這樣的情境與現實世界的軟體開發差距甚大。專業程式設計通常涉及既有的程式庫、複雜的依賴關係，以及長期演化而成的業務邏輯。實驗室裡這種「無菌環境」根本無法反映真實的開發挑戰。

過度依賴自我回報的調查

Stanford 研究團隊曾要求 43 名開發者自行評估相對於全球平均的生產力，並將自己放入五個百分位區間之一。

結果顯示，自我評估與實際測量數據的相關性極差，幾乎等同於「擲硬幣」。開發者平均誤判了約 30 個百分位點，只有三分之一能正確估算自己大致所在的區間。

調查雖然仍然有助於理解開發者對 AI 工具的滿意度與士氣，但顯然不能可靠衡量實際生產力影響。這一發現對眾多依賴自我調查報告來支持 AI 成效論述的產業研究，具有重大挑戰意義。

ThisisEngineering null on Unsplash

許多研究將提交次數（commits）、pull requests 或完成的任務數視為生產力指標，假設「更多的活動」就等於「更高的生產力」。

重構四大衡量指標

認知到上述限制後，Stanford 提出了更精緻的方法，超越了單純的「程式碼行數」或「提交頻率」。他們的方法核心在於 分析程式碼變更實際交付的功能性，而不是僅僅看表面上的活動量。

理想的測量系統應由 10 至 15 位資深工程師組成專家小組，從多個面向獨立評估每段程式碼：品質、可維護性、輸出價值與實作時間。

為了解決此問題，Denisov-Blanch 的團隊開發了一套能自動模擬專家評估的模型。該系統與 Git 儲存庫整合，能分析每次提交的程式碼變更，並在與人類專家相同的維度上進行量化。

這套方法揭露了傳統簡單指標無法察覺的生產力模式。系統將程式碼變更分為四種類型：

新增功能（added functionality）
刪除功能（removed functionality）
重構（refactoring）
返工（rework，修復最近的程式碼，通常代表浪費性活動）

透過這種細緻的分類，AI 導入的隱性成本與收益才得以被完整揭示。

生產力提升伴隨隱藏成本

當 Denisov-Blanch 將這套方法應用於跨公司 AI 導入案例時，結果顯示出比廠商宣稱的「單純效率提升」更加複雜的面貌。

一個典型案例是一間擁有 120 名開發者的公司，在九月全面導入 AI 工具。表面數據看來成效顯著：

程式碼輸出量大幅增加，提交次數與開發活動大幅提升。

然而，深入分析卻揭露了令人憂慮的模式：雖然總產出激增，但其中很大一部分來自「返工」 開發者需要修復近期 AI 所生成的程式錯誤。

數據顯示，AI 導入通常會帶來 30–40% 的「總生產力提升」，也就是開發者確實產生了更多程式碼。但若考慮修復與調整所耗費的額外時間，「淨生產力提升」平均僅為 15–20%。這中間的落差，正是 AI 的隱性成本：

即處理 AI 初稿錯誤所需的額外工作量

這也解釋了為什麼許多組織在導入 AI 後，感覺「比以前更忙」，卻不覺得「完成得更多」。開發者確實寫了更多程式、處理更多任務，但其中相當部分只是清理 AI 自己製造的問題。

開發者確實寫了更多程式、處理更多任務，但其中相當部分只是清理 AI 自己製造的問題。Photo by Procreator Global UI UX Design Agency on Unsplash

AI 不擅長維護與除錯

Stanford 的分析指出，AI 的效能與任務複雜度高度相關，結果挑戰了業界對 AI 工具適用範圍的常見假設。

在 低複雜度任務 中，AI 的優勢顯著，尤其是在 greenfield 專案中（從零開始建立新系統）。當開發者處理簡單、定義明確的新問題時，AI 能帶來 30–40% 的效率提升。這正好符合 AI 的強項：

模式識別、樣板程式碼生成、以及標準演算法與資料結構的實作。

然而，Denisov-Blanch 指出，隨著任務複雜度增加，AI 的效能顯著下降。

在 高複雜度的 greenfield 任務 中，效率提升僅剩 10–15%；而在 高複雜度的 brownfield 開發（即在既有程式基礎上進行維護與擴充）中，效益僅有 0–10%，甚至有些情況會導致效率下降，因為開發者花在修正 AI 錯誤的時間超過了原本的時間。

研究還揭示了 greenfield 與 brownfield 的重要差異。greenfield 開發由於缺乏既有上下文與歷史依賴，AI 能發揮更大作用（AI 能發揮的自由度更大）。

但現實世界更大量出現的專案型態卻是 brownfield 開發，AI 工具往往難以理解既有程式架構、遵循既有模式與慣例、並在複雜依賴關係中正確運作。

Denisov-Blanch 也解釋，這就是為什麼許多有經驗的開發者對 AI 工具有著複雜感受：

AI 在「全新功能開發」這類少數情境下相當有用，但對「維護、除錯與改進既有系統」這類佔大多數的任務，幫助卻十分有限。

留言

留言分享你的想法！

社會人的哲學沉思

142會員

303內容數

從物理到電機工程再轉到資訊傳播，最後落腳在社會學。衣櫃拿來當書櫃擺的人。我常在媒介生態學、傳播理論、社會學、心理學、哲學游移；期盼有天無產階級可以推倒資本主義的高牆的兼職家教。

社會人的哲學沉思的其他內容

2025/08/26

📝📝：中元祭為何是「雞籠」而不是「基隆」｜宗教儀式所建構的民族認同

中元祭作為全台最大的宗教盛事，曾特此正名為「雞籠」中元祭，以凸顯台灣曾經的移民歷史以及民族多元性。

2025/08/26

📝📝：中元祭為何是「雞籠」而不是「基隆」｜宗教儀式所建構的民族認同

中元祭作為全台最大的宗教盛事，曾特此正名為「雞籠」中元祭，以凸顯台灣曾經的移民歷史以及民族多元性。

2025/08/22

📝📝：Katherine Hayles 談 AI 與創造力｜不需以人類的標準檢測機器的創造力

我們不需以人類的標準檢測機器的智能，機器本身可以偶屬於它們自身脈絡的感知世界。

2025/08/22

📝📝：Katherine Hayles 談 AI 與創造力｜不需以人類的標準檢測機器的創造力

我們不需以人類的標準檢測機器的智能，機器本身可以偶屬於它們自身脈絡的感知世界。

2025/08/19

📝📝：物件筆記｜地球儀｜來吧！讓我們用上帝視角俯瞰這顆藍色星球

藉著地球儀，人類首次能夠脫離地表，以上帝的視角觀看世界。

2025/08/19

📝📝：物件筆記｜地球儀｜來吧！讓我們用上帝視角俯瞰這顆藍色星球

藉著地球儀，人類首次能夠脫離地表，以上帝的視角觀看世界。

#AI 的其他內容

Google Stitch：生成 UI 介面設計，加速產品原型開發與協作

張紹宏

Gemini Pro 學生方案怎麼一直申請失敗? 原來是少做了「這件事」!

你可能也想看

福利熊的吃喝玩樂日誌

當媽媽後的購物日常分享：我的育兒好物推薦！

身為新手媽媽，育兒生活讓你無法逛街？別擔心！本文精選多款網購必備母嬰用品，包含寶寶粥、尿布、玩具、童書、衣物和育成椅，並分享實用的省錢購物技巧，讓你輕鬆購得好物，享受聰明網購樂趣。另有蝦皮雙11購物節與分潤計畫介紹，幫助你省荷包，開創斜槓收入。

#蝦皮#育兒#雙11購物節

2025/11/05

福利熊的吃喝玩樂日誌

當媽媽後的購物日常分享：我的育兒好物推薦！

#蝦皮#育兒#雙11購物節

2025/11/05

馬許桑的沙龍

從一件衣服開始的冬季裝備升級 x 雙11蝦皮購物攻略＋蝦皮分潤計畫推薦

本文開箱介紹 Fjällräven Räven Anorak 機能外套，分享其 G-1000® Lite 布料的特性、絕佳機能性、透氣性及簡潔設計。並提供蝦皮雙11購物攻略與介紹蝦皮分潤計畫，讓內容創作者也能透過分享好物賺取被動收入，為迎接寒冬做好裝備與荷包的雙重準備！

#方格子#蝦皮購物#蝦皮分潤計畫

2025/11/06

馬許桑的沙龍

從一件衣服開始的冬季裝備升級 x 雙11蝦皮購物攻略＋蝦皮分潤計畫推薦

#方格子#蝦皮購物#蝦皮分潤計畫

2025/11/06

Rio Chen的沙龍

如何利用AI 減少工作壓力並提升企業效率

激烈的商業環境中，企業領導人無不尋求提高效率和生產力的新方法。人工智慧（AI）正逐漸成為他們的首選工具。從自動化日常任務到提升決策質量，AI正在改變我們的工作方式，使員工能夠將更多時間和精力投入到更具創造性和戰略性的工作中。這篇文章將探討AI如何減少工作勞累，並分析企業如何利用這一技術優勢。

2024/07/20

2024/07/20

14天每天超過10小時共2,700餘張圖片生成大量操作，AI繪圖用於商業製作的利與弊。

#Midjourney#AI繪圖#midjourney角色一致性

2024/07/15

是我啦，我好學啦

首次用AI應用在接案，好好用？

14天每天超過10小時共2,700餘張圖片生成大量操作，AI繪圖用於商業製作的利與弊。

#Midjourney#AI繪圖#midjourney角色一致性

2024/07/15

佩雯姐的小宇宙

科技實現了工作不同的想像

老實說，原本的我一直認為，AI是離我很遠的東西，即使是去年的 ChatGPT 熱潮，我也只是跟著偶爾在工作中跟AI聊天激發靈感而已。不過，就在前一陣子看了《AI 世界的底層邏輯與生存法則》這本書後，我才逐漸加深使用AI的頻率，並且把「讓AI成為工作中的標配」當作讓自己能習慣的方向。

#AI世界的底層邏輯與生存法則#AI繪圖#身心障礙

2024/06/30

佩雯姐的小宇宙

科技實現了工作不同的想像

#AI世界的底層邏輯與生存法則#AI繪圖#身心障礙

2024/06/30

Everything ✨

在 AGI 通用人工智慧的時代，Data Scientist 的工作還有價值嗎？

AI 的快速發展，顛覆了各個產業的發展，ChatGPT 的出現，加快了作家寫作的速度，加快了工程師寫程式的速度，世界正在快速的改變。許多人開始探究自己的工作會不會被 AI 取代，身為資料領域的工作者，我也開始在思考，當 AI 的能力不斷進化且遠遠超過人類時，在我的工作中有哪些任務交給 AI 會更

#數據#ChatGPT#模型

2024/06/04

Everything ✨

在 AGI 通用人工智慧的時代，Data Scientist 的工作還有價值嗎？

#數據#ChatGPT#模型

2024/06/04

塔羅Lab.研究生在幹嘛?

AI 與未來職場的變化

通用型AI還沒那麼快出現所以說人類的工作要全面被取代目前不會發生但如果是"部分"的專精工作可以被模組化高重複性可被預測與其說取代人類工作不如說 AI可以替代部分"流程" 如果有專屬於法律條文聊天機器人或是專屬於公司內部規章的聊天機器人遇到問題或是不確定的流程直接詢

2024/05/01

2024/05/01

已經成真的AI生成文字、圖片、音樂、影片，以及接下來更多的AI運用場景，每一項都將對人類社會產生重大的影響：包括抽象的人心、文化、審美、親密關係，以及實質的就業、經濟、生活、生涯規劃等。本文我會以大量使用、測試AI的經驗，輔以田野調查的經驗，詳細說明AI時代最應該培養的四項能力。

2024/03/31

2024/03/31

數位化時代中，人工智能（AI）已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性，並提出負責任地發展和使用AI的思考。

#挑戰#人工智能#責任

2024/03/12

米奇幻世界

人工智能：未來的新篇章

數位化時代中，人工智能（AI）已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性，並提出負責任地發展和使用AI的思考。

#挑戰#人工智能#責任

2024/03/12

存股筆記 (2024-02-27) - AI 應用與經濟衰退

AI 對於這個世界絕對是全新的幫助，也有明確的商業模式你再也不需要請人寫文案，照片和影像可以即時產出對於語言和世界的理銞也會變得快速這一切都在快速地改變世界當中但其危險的是，隱隱約約有著要泡沬化的步調

2024/02/27

存股筆記 (2024-02-27) - AI 應用與經濟衰退

2024/02/27

Offision 智能辦公室資訊平台

Offision：人工智能辦公室平臺

在現代辦公室環境中，人工智慧（AI）技術的應用已經變得越來越普遍，並且對提高工作效率和生產力起到了重要作用。

#管理#預約#會議

2024/01/16

Offision 智能辦公室資訊平台

Offision：人工智能辦公室平臺

在現代辦公室環境中，人工智慧（AI）技術的應用已經變得越來越普遍，並且對提高工作效率和生產力起到了重要作用。

#管理#預約#會議

2024/01/16

最好的知己

AI沒有那麼難!從0基礎到會用AI，打造高效的職場工作法

如果要說2023的熱門話題，AI人工智慧一定是榜上有名的吧! 然而隨著越來越多的AI工具出現，你內心一定會有個疑問... 人類到底會被AI取代? 我認為，AI能取代的是「重複性高」的工作，而不是所有工作。

#AI人工智慧#學習#競爭力

2023/12/26

最好的知己

AI沒有那麼難!從0基礎到會用AI，打造高效的職場工作法

#AI人工智慧#學習#競爭力

2023/12/26

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News