📝📝:導入 AI 後,反而感覺比以前更忙|史丹佛研究員:AI 運行的環境和任務過於「無菌」

更新於 發佈於 閱讀時間約 7 分鐘

AI 運行的環境和執行的任務都過於「無菌」,與現實世界有一定的差落差。

本篇參考自史丹佛大學的研究員 Yegor Denisov-Blanch 的研究成果,完整演講也已公布《Does AI Actually Boost Developer Productivity?




史丹佛大學的研究員 Yegor Denisov-Blanch 在過去三年中展開了規模龐大的研究,針對超過 600 間公司、逾 10 萬名軟體工程師、數千萬次程式提交(commits)、以及數十億行程式碼進行分析。

Denisov-Blanch 發現,目前業界所宣稱 AI 能帶來的「生產力榮景」,其實過於誇大也同時忽略了背後的隱藏成本。更重要的是,AI 運行的環境和執行的任務都過於「無菌」,與現實世界有一定的差落差。




生產力的迷思

關於 AI 如何影響開發者生產力的現有研究,大多存在三個關鍵性限制,嚴重削弱了這些研究在真實世界中的可靠性與適用性。


衡量指標的錯誤

許多研究將提交次數(commits)、pull requests 或完成的任務數視為生產力指標,假設「更多的活動」就等於「更高的生產力」。然而,這種方法根本誤解了軟體開發工作的本質。

不同任務的複雜程度差異極大,提交次數增加並不必然意味著真正的效率提升。Stanford 的研究甚至揭示了一個令人憂慮的現象:

AI 經常產生額外任務,因為它本身先寫出有缺陷的程式碼,隨後又需要人類開發者進行修補。

結果導致開發者看似更忙碌,實際上卻在無效循環中打轉。

​​


研究設計的人工化

大多數受控實驗會將開發者分成兩組,一組使用 AI 工具,另一組則不使用,然後要求雙方完成「greenfield」任務:從零開始開發全新專案、完全沒有既有上下文。在這類情境中,AI 確實經常表現優於純人類方法。

但問題在於,這樣的情境與現實世界的軟體開發差距甚大。專業程式設計通常涉及既有的程式庫、複雜的依賴關係,以及長期演化而成的業務邏輯。實驗室裡這種「無菌環境」根本無法反映真實的開發挑戰

​​


過度依賴自我回報的調查

Stanford 研究團隊曾要求 43 名開發者自行評估相對於全球平均的生產力,並將自己放入五個百分位區間之一。

結果顯示,自我評估與實際測量數據的相關性極差,幾乎等同於「擲硬幣」。開發者平均誤判了約 30 個百分位點,只有三分之一能正確估算自己大致所在的區間。

調查雖然仍然有助於理解開發者對 AI 工具的滿意度與士氣,但顯然不能可靠衡量實際生產力影響。這一發現對眾多依賴自我調查報告來支持 AI 成效論述的產業研究,具有重大挑戰意義。

許多研究將提交次數(commits)、pull requests 或完成的任務數視為生產力指標,假設「更多的活動」就等於「更高的生產力」。

​​


重構四大衡量指標

認知到上述限制後,Stanford 提出了更精緻的方法,超越了單純的「程式碼行數」或「提交頻率」。他們的方法核心在於 分析程式碼變更實際交付的功能性,而不是僅僅看表面上的活動量。

理想的測量系統應由 10 至 15 位資深工程師組成專家小組,從多個面向獨立評估每段程式碼:品質、可維護性、輸出價值與實作時間。

為了解決此問題,Denisov-Blanch 的團隊開發了一套能自動模擬專家評估的模型。該系統與 Git 儲存庫整合,能分析每次提交的程式碼變更,並在與人類專家相同的維度上進行量化。

這套方法揭露了傳統簡單指標無法察覺的生產力模式。系統將程式碼變更分為四種類型:

  1. 新增功能(added functionality)
  2. 刪除功能(removed functionality)
  3. 重構(refactoring)
  4. 返工(rework,修復最近的程式碼,通常代表浪費性活動)

透過這種細緻的分類,AI 導入的隱性成本與收益才得以被完整揭示。

​​


生產力提升伴隨隱藏成本

當 Denisov-Blanch 將這套方法應用於跨公司 AI 導入案例時,結果顯示出比廠商宣稱的「單純效率提升」更加複雜的面貌。

一個典型案例是一間擁有 120 名開發者的公司,在九月全面導入 AI 工具。表面數據看來成效顯著:

程式碼輸出量大幅增加,提交次數與開發活動大幅提升。

然而,深入分析卻揭露了令人憂慮的模式:雖然總產出激增,但其中很大一部分來自「返工」 開發者需要修復近期 AI 所生成的程式錯誤

數據顯示,AI 導入通常會帶來 30–40% 的「總生產力提升」,也就是開發者確實產生了更多程式碼。但若考慮修復與調整所耗費的額外時間,「淨生產力提升」平均僅為 15–20%。這中間的落差,正是 AI 的隱性成本:

即處理 AI 初稿錯誤所需的額外工作量

這也解釋了為什麼許多組織在導入 AI 後,感覺「比以前更忙」,卻不覺得「完成得更多」。開發者確實寫了更多程式、處理更多任務,但其中相當部分只是清理 AI 自己製造的問題

開發者確實寫了更多程式、處理更多任務,但其中相當部分只是清理 AI 自己製造的問題。Photo by Procreator Global UI UX Design Agency on Unsplash

開發者確實寫了更多程式、處理更多任務,但其中相當部分只是清理 AI 自己製造的問題。Photo by Procreator Global UI UX Design Agency on Unsplash


AI 不擅長維護與除錯

Stanford 的分析指出,AI 的效能與任務複雜度高度相關,結果挑戰了業界對 AI 工具適用範圍的常見假設。

低複雜度任務 中,AI 的優勢顯著,尤其是在 greenfield 專案中(從零開始建立新系統)。當開發者處理簡單、定義明確的新問題時,AI 能帶來 30–40% 的效率提升。這正好符合 AI 的強項:

模式識別、樣板程式碼生成、以及標準演算法與資料結構的實作。

然而,Denisov-Blanch 指出,隨著任務複雜度增加,AI 的效能顯著下降。

高複雜度的 greenfield 任務 中,效率提升僅剩 10–15%;而在 高複雜度的 brownfield 開發(即在既有程式基礎上進行維護與擴充)中,效益僅有 0–10%,甚至有些情況會導致效率下降,因為開發者花在修正 AI 錯誤的時間超過了原本的時間

研究還揭示了 greenfield 與 brownfield 的重要差異。greenfield 開發由於缺乏既有上下文與歷史依賴,AI 能發揮更大作用(AI 能發揮的自由度更大)。

但現實世界更大量出現的專案型態卻是 brownfield 開發,AI 工具往往難以理解既有程式架構、遵循既有模式與慣例、並在複雜依賴關係中正確運作。




Denisov-Blanch 也解釋,這就是為什麼許多有經驗的開發者對 AI 工具有著複雜感受:

AI 在「全新功能開發」這類少數情境下相當有用,但對「維護、除錯與改進既有系統」這類佔大多數的任務,幫助卻十分有限
留言
avatar-img
留言分享你的想法!
avatar-img
社會人的哲學沉思
132會員
283內容數
從物理到電機工程再轉到資訊傳播,最後落腳在社會學。衣櫃拿來當書櫃擺的人。我常在媒介生態學、傳播理論、社會學、心理學、哲學游移;期盼有天無產階級可以推倒資本主義的高牆的兼職家教。
2025/08/26
中元祭作為全台最大的宗教盛事,曾特此正名為「雞籠」中元祭,以凸顯台灣曾經的移民歷史以及民族多元性。
Thumbnail
2025/08/26
中元祭作為全台最大的宗教盛事,曾特此正名為「雞籠」中元祭,以凸顯台灣曾經的移民歷史以及民族多元性。
Thumbnail
2025/08/22
我們不需以人類的標準檢測機器的智能,機器本身可以偶屬於它們自身脈絡的感知世界。
Thumbnail
2025/08/22
我們不需以人類的標準檢測機器的智能,機器本身可以偶屬於它們自身脈絡的感知世界。
Thumbnail
2025/08/19
藉著地球儀,人類首次能夠脫離地表,以上帝的視角觀看世界。
Thumbnail
2025/08/19
藉著地球儀,人類首次能夠脫離地表,以上帝的視角觀看世界。
Thumbnail
看更多
你可能也想看
Thumbnail
2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》,我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物;這次活動不僅送出了許多獎勵,也反映了「內容有價」——創作不只是分享、紀錄,也能用各種不同形式變現、帶來實際收入。
Thumbnail
2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》,我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物;這次活動不僅送出了許多獎勵,也反映了「內容有價」——創作不只是分享、紀錄,也能用各種不同形式變現、帶來實際收入。
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
激烈的商業環境中,企業領導人無不尋求提高效率和生產力的新方法。人工智慧(AI)正逐漸成為他們的首選工具。 從自動化日常任務到提升決策質量,AI正在改變我們的工作方式,使員工能夠將更多時間和精力投入到更具創造性和戰略性的工作中。這篇文章將探討AI如何減少工作勞累,並分析企業如何利用這一技術優勢。
Thumbnail
激烈的商業環境中,企業領導人無不尋求提高效率和生產力的新方法。人工智慧(AI)正逐漸成為他們的首選工具。 從自動化日常任務到提升決策質量,AI正在改變我們的工作方式,使員工能夠將更多時間和精力投入到更具創造性和戰略性的工作中。這篇文章將探討AI如何減少工作勞累,並分析企業如何利用這一技術優勢。
Thumbnail
14天每天超過10小時共2,700餘張圖片生成大量操作,AI繪圖用於商業製作的利與弊。
Thumbnail
14天每天超過10小時共2,700餘張圖片生成大量操作,AI繪圖用於商業製作的利與弊。
Thumbnail
老實說,原本的我一直認為,AI是離我很遠的東西,即使是去年的 ChatGPT 熱潮,我也只是跟著偶爾在工作中跟AI聊天激發靈感而已。不過,就在前一陣子看了《AI 世界的底層邏輯與生存法則》這本書後,我才逐漸加深使用AI的頻率,並且把「讓AI成為工作中的標配」當作讓自己能習慣的方向。
Thumbnail
老實說,原本的我一直認為,AI是離我很遠的東西,即使是去年的 ChatGPT 熱潮,我也只是跟著偶爾在工作中跟AI聊天激發靈感而已。不過,就在前一陣子看了《AI 世界的底層邏輯與生存法則》這本書後,我才逐漸加深使用AI的頻率,並且把「讓AI成為工作中的標配」當作讓自己能習慣的方向。
Thumbnail
AI 的快速發展,顛覆了各個產業的發展,ChatGPT 的出現,加快了作家寫作的速度,加快了工程師寫程式的速度,世界正在快速的改變。許多人開始探究自己的工作會不會被 AI 取代,身為資料領域的工作者,我也開始在思考,當 AI 的能力不斷進化且遠遠超過人類時,在我的工作中有哪些任務交給 AI 會更
Thumbnail
AI 的快速發展,顛覆了各個產業的發展,ChatGPT 的出現,加快了作家寫作的速度,加快了工程師寫程式的速度,世界正在快速的改變。許多人開始探究自己的工作會不會被 AI 取代,身為資料領域的工作者,我也開始在思考,當 AI 的能力不斷進化且遠遠超過人類時,在我的工作中有哪些任務交給 AI 會更
Thumbnail
通用型AI還沒那麼快出現 所以說人類的工作要全面被取代 目前不會發生 但如果是"部分"的專精工作 可以被模組化 高重複性 可被預測 與其說取代人類工作 不如說 AI可以替代部分"流程" 如果有專屬於法律條文聊天機器人 或是 專屬於公司內部規章的聊天機器人 遇到問題 或是不確定的流程 直接詢
Thumbnail
通用型AI還沒那麼快出現 所以說人類的工作要全面被取代 目前不會發生 但如果是"部分"的專精工作 可以被模組化 高重複性 可被預測 與其說取代人類工作 不如說 AI可以替代部分"流程" 如果有專屬於法律條文聊天機器人 或是 專屬於公司內部規章的聊天機器人 遇到問題 或是不確定的流程 直接詢
Thumbnail
已經成真的AI生成文字、圖片、音樂、影片,以及接下來更多的AI運用場景,每一項都將對人類社會產生重大的影響:包括抽象的人心、文化、審美、親密關係,以及實質的就業、經濟、生活、生涯規劃等。 本文我會以大量使用、測試AI的經驗,輔以田野調查的經驗,詳細說明AI時代最應該培養的四項能力。
Thumbnail
已經成真的AI生成文字、圖片、音樂、影片,以及接下來更多的AI運用場景,每一項都將對人類社會產生重大的影響:包括抽象的人心、文化、審美、親密關係,以及實質的就業、經濟、生活、生涯規劃等。 本文我會以大量使用、測試AI的經驗,輔以田野調查的經驗,詳細說明AI時代最應該培養的四項能力。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
AI 對於這個世界絕對是全新的幫助,也有明確的商業模式 你再也不需要請人寫文案,照片和影像可以即時產出 對於語言和世界的理銞也會變得快速 這一切都在快速地改變世界當中 但其危險的是,隱隱約約有著要泡沬化的步調
Thumbnail
AI 對於這個世界絕對是全新的幫助,也有明確的商業模式 你再也不需要請人寫文案,照片和影像可以即時產出 對於語言和世界的理銞也會變得快速 這一切都在快速地改變世界當中 但其危險的是,隱隱約約有著要泡沬化的步調
Thumbnail
在現代辦公室環境中,人工智慧(AI)技術的應用已經變得越來越普遍,並且對提高工作效率和生產力起到了重要作用。
Thumbnail
在現代辦公室環境中,人工智慧(AI)技術的應用已經變得越來越普遍,並且對提高工作效率和生產力起到了重要作用。
Thumbnail
如果要說2023的熱門話題,AI人工智慧一定是榜上有名的吧! 然而隨著越來越多的AI工具出現,你內心一定會有個疑問... 人類到底會被AI取代? 我認為,AI能取代的是「重複性高」的工作,而不是所有工作。
Thumbnail
如果要說2023的熱門話題,AI人工智慧一定是榜上有名的吧! 然而隨著越來越多的AI工具出現,你內心一定會有個疑問... 人類到底會被AI取代? 我認為,AI能取代的是「重複性高」的工作,而不是所有工作。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News