AI徹底打敗絕對大多數人類工程師

2024/09/25 更新2024/09/25 發佈閱讀 4 分鐘

投資理財內容聲明

結論：除非是頂尖工程師，否則AI完勝平均能力值的工程師，AI仍然是值得長期投資與期待的一門生意，具有相當的投資價值與生產力改進，投資，不單只是財務的數字，更應該依據科技與時代的轉變，進行有效的長期投資標的選擇。

摘要

CodeSignal 的 AI 基準報告比較了多種 AI 模型的軟體工程技能，發現某些模型如 o1-preview 在某些指標上表現卓越，但頂尖人類工程師在綜合表現上仍然超越 AI 模型。

AI 模型能有效解決部分編碼任務，但在複雜或不可預測的問題上人類的直覺與創造力更具優勢。藉由結合 AI 和人類能力，公司可以在難以解決的工程挑戰中實現更高效的性能。CodeSignal 提供的 AI 輔助編碼框架和測評工具，旨在幫助企業在開發工作流程中更好地整合 AI，並促進人類與 AI 的合作。

關鍵點

CodeSignal 的 AI 基準報告比較多種 AI 模型的編碼技能與人類工程師。
測試涵蓋159種框架測評，使用同一題庫評估AI與人類。
評估標準包括平均分數和解決率，顯示AI在某些方面表現優秀。
雖然一些AI模型如o1-preview在指標中名列前茅，但人類頂尖候選人仍在所有模型中表現最佳。
測試表明，在1次到3次測試中的改進顯著，超過5次測試的效益下降。
人類的直覺和創造力在解決複雜或少數案例問題中更具優勢。
CodeSignal 的 AI 輔助編碼框架支持評估候選人如何使用AI協助碼的能力。

在當今程式設計領域，AI技術的迅速進步引發了軟體工程師角色和能力的重新評估。根據 CodeSignal 的最新報告，AI模組在編碼和問題解決能力上，已經逐漸超越了一般的軟體工程師，尤其是如 OpenAI 的o1-preview及o1-mini等先進模型。這些AI能有效解決實際問題，並在大多數情況下表現穩定¹。模型的排名如下：

頂尖軟體工程師
o1-preview
o1-mini
Claude-3.5-Sonnet
GPT-4o
Llama3.1-405b
Gemini-1.5-pro
GPT-4o-mini
一般軟體工程師
Gemini-1.5-flash
GPT-3.5-turbo

這顯示出，普通的軟體工程師已無法與大多數當前最流行的AI模型相比，尤其是在編寫複雜程式碼和穩健性方面。

評估方法

這份報告的評估方法並非僅僅測試工程師的理論知識，而是使用目前科技和金融行業中的面試問題進行實際測試，共涉及159種題目，主要測試的都是包含40至60行程式碼的問題³。

AI 模型表現

o1-preview 和 o1-mini：這兩個模型在各項指標中的表現顯著，表示這些模型在不同程式問題解決上普遍優於其他競爭者。
GPT-4o：在完整問題解決中表現優異，具備根據反饋來逐步改善解答的能力，這使它像人類工程師一樣能夠逐步修正錯誤。
Claude 3.5 Sonnet：雖然它在解決較簡單的問題時表現更佳，但在多次嘗試的情況下，其能力可能會下滑，特別是在超過五次嘗試時。

人類與AI的比較

報告指出，雖然大部分AI模型的表現超越了一般預篩選的軟體工程師，但最頂尖的人類候選者在各項指標上仍然持續優於所有AI模型。舉例來說，排名第一的o1-preview模型未能完全解決25%人類候選者能夠成功解決的問題，突顯了人類在一些複雜性和不確定性較高的情境中的優勢。

未來的展望

值得注意的是，儘管AI模型正在逐步強大，但人類工程師仍在某些獨特的問題解決領域中展現出優勢，特別是那些涉及創造力、直覺和道德判斷的複雜任務。這表明未來的工作場景將可能是人類和AI之間的合作，而非單方的取代。因此，軟體工程師專業的核心價值不再僅僅是在寫代碼上，而是如何有效地與AI共同合作，及其在解決問題時能夠提供額外的洞見和應對挑戰的能力。

這些觀察強調了在不斷變化的技術界中，保持學習和適應能力的重要性，因為未來仍會出現不少新挑戰與機遇。

參考出處

https://codesignal.com/blog/engineering/ai-coding-benchmark-with-human-comparison/

留言

留言分享你的想法！

分析師的市場觀點

269會員

1.2K內容數

很高興能夠成為你實踐財富自由的第一步，歡迎瀏覽進階訂閱方案原價每天不到5元，CP值最高，超越報紙資訊的法人投行分析。精簡快速分享投行法人研究及操盤思維希望能讓你我用最少時間、精力、資金洞察近期金融市場的變化與重點分享。

分析師的市場觀點的其他內容

2025/05/02

外資大摩看FOMC會議前預覽，立場穩固，等待更明確的訊號

摘要摩根士丹利預測，聯準會（Fed）在2025年5月的會議中將維持利率不變，並強調政策已「妥善定位」以應對關稅衝擊帶來的雙重風險：通膨上升與就業放緩。報告指出，關稅政策將導致通膨暫時性上升，甚至可能持續，而Fed傾向等待更明確的數據後再行動。儘管市場預期2025年將降息100個基點，Fed可能保

2025/05/02

外資大摩看FOMC會議前預覽，立場穩固，等待更明確的訊號

2025/05/02

外資大摩MS看META財報，（META）在2025年第一季的營收表現優於預期

摘要摩根士丹利報告指出，Meta Platforms（META）在2025年第一季的營收表現優於預期，顯示其透過GPU技術提升用戶參與度和廣告變現能力。儘管資本支出增加至720億美元，Meta仍能有效控制營運支出，並在宏觀經濟不確定性下維持增長。報告上調2025/26年每股盈餘（EPS）預測，目

2025/05/02

外資大摩MS看META財報，（META）在2025年第一季的營收表現優於預期

2025/05/02

美股三大CSP財報齊發，懶人包整理，大多優於市場預期，僅亞馬遜擔心關稅

結論：大多優於市場預期，股價出現上漲結論：微軟FY3Q25財報(截至2025.03.31)表現亮眼，Azure雲端業務強勁成長33%（其中AI服務貢獻16個百分點），帶動營收及獲利皆優於市場預期，第四季財測也超乎市場預期，盤後股價大漲8%。一、營運概況： 1. 2025財年第3季營

2025/05/02

美股三大CSP財報齊發，懶人包整理，大多優於市場預期，僅亞馬遜擔心關稅

#股票的其他內容

【理財讀書筆記06】只買一支股, 勝過18%: 理財專家不敢教你的事

你可能也想看

手作人必看｜用蝦皮分潤計畫把興趣變新收入渠道

在小小的租屋房間裡，透過蝦皮購物平臺採購各種黏土、模型、美甲材料等創作素材，打造專屬黏土小宇宙的療癒過程。文中分享多個蝦皮挖寶地圖，並推薦蝦皮分潤計畫。

#手作#黏土手作#輕黏土

2025/09/09

Chloe小窩

手作人必看｜用蝦皮分潤計畫把興趣變新收入渠道

#手作#黏土手作#輕黏土

2025/09/09

小蝸慢慢爬

蝦皮分潤計畫-小豬與小蝸的婚姻神隊友

小蝸和小豬因購物習慣不同常起衝突，直到發現蝦皮分潤計畫，讓小豬的購物愛好產生價值，也讓小蝸開始欣賞另一半的興趣。想增加收入或改善伴侶間的購物觀念差異？讓蝦皮分潤計畫成為你們的神隊友吧！

2025/09/09

2025/09/09

【文創漫談】程式設計與技術能力 | 如何利用AI | 增強能力

程式設計與技術能力在現代社會中的重要性越來越明顯，尤其是在人工智能（AI）和自動化技術迅速發展的背景下。理解編程語言，如Python、R等，以及熟悉相關技術架構和工具，能夠幫助個人在這樣的環境中更好地工作。這種能力不僅對技術專業人士至關重要，也對非技術領域的人士日益重要，因為基礎的程式設計知識已

#文創漫談#程式設計與技術能力#如何利用AI

2024/07/29

普普文創

【文創漫談】程式設計與技術能力 | 如何利用AI | 增強能力

#文創漫談#程式設計與技術能力#如何利用AI

2024/07/29

老葉報報

還沒有，還沒有，AI還不能取代人類

AI真的能取代人類嗎？或許有一些工作不再需要那麼多人，但是，不會有哪一種工作完全不需要人來做。人類能做什麼？

#AI#人工智慧

2024/06/23

老葉報報

還沒有，還沒有，AI還不能取代人類

AI真的能取代人類嗎？或許有一些工作不再需要那麼多人，但是，不會有哪一種工作完全不需要人來做。人類能做什麼？

#AI#人工智慧

2024/06/23

有所知zhi的沙龍

讓ChatGPT來考113年會考作文……

先寫結論： AI真的很厲害，而且只會愈來愈厲害，但我們人類還是得繼續學習。而且因為AI工具的便利，人類學習將更貼近學習的本質---為了成長和幸福。以往為了應付工業化進程而必須花大量時間反覆記誦或演練的重複性工作，將大量減少，也不再需要花大量時間學習某些特定目標的應用技能工具，如：『文件繕打

2024/05/31

2024/05/31

已經成真的AI生成文字、圖片、音樂、影片，以及接下來更多的AI運用場景，每一項都將對人類社會產生重大的影響：包括抽象的人心、文化、審美、親密關係，以及實質的就業、經濟、生活、生涯規劃等。本文我會以大量使用、測試AI的經驗，輔以田野調查的經驗，詳細說明AI時代最應該培養的四項能力。

2024/03/31

2024/03/31

這篇文章探討了人工智能對未來的影響，提到了人工智能不斷進步的速度，以及預測了未來幾年人工智能的發展。同時也提到了人工智能對人類的影響，包括了代替工程師寫CODE以及瞭解和療癒人類情緒。

2024/03/28

2024/03/28

Eve's Salon: 投資自己就是「最好的投資」

如何避免AI取代？答案其實很簡單

AI的快速發展震驚全球，每個人都焦急的希望找到未來的趨勢 — 「到底哪類職業不會被取代？」，為求自保。我認為AI最終能在所有領域輕易的透過一個指令的輸入，就能輸出一個「平均值水準的成果」。那麼如何才能超越平均值？則必須選擇自己所熱愛的領域。點擊閱讀了解為什麼。

#顧問#管理#生成式AI

2024/03/21

Eve's Salon: 投資自己就是「最好的投資」

2024/03/21

理由很簡單，就算 AI 和人一樣強大，比如貢獻值是 1，只需要一般人往上面加個 0.1，那麼你的成品就超過了 AI 的作品了⋯ 不懂 AI 的人會過時嗎，會被淘汰嗎？可以說是又可以說不是⋯ 不懂 AI 的人的薪酬肯定被降低了，不過不等於會消失⋯ 就像很多人也不懂電腦的專業知識，比如連簡單的計

2024/03/20

2024/03/20

坦白說，我不是那種看衰AI發展的悲觀論者。對我來說，AI要是發展得順利，可以取代人類工作，或許人類才真的可以從名為工作的輪迴當中解放出來也說不定。但是，但是但是但是，我非常不能接受的，就是那些用AI製圖或寫文就自稱自己是繪師或圖文作家的AI仔。如果你也是那種AI仔，聽好囉？畫圖這回事

2024/03/05

2024/03/05

【AI 不會取代人類，但使用 AI 的人會取代不用AI的人】

#啟發隨想#AI#KarimLakhani

2024/02/11

《創作者事業研究室》沙龍

【AI 不會取代人類，但使用 AI 的人會取代不用AI的人】

#啟發隨想#AI#KarimLakhani

2024/02/11

最好的知己

AI沒有那麼難!從0基礎到會用AI，打造高效的職場工作法

如果要說2023的熱門話題，AI人工智慧一定是榜上有名的吧! 然而隨著越來越多的AI工具出現，你內心一定會有個疑問... 人類到底會被AI取代? 我認為，AI能取代的是「重複性高」的工作，而不是所有工作。

#AI人工智慧#學習#競爭力

2023/12/26

最好的知己

AI沒有那麼難!從0基礎到會用AI，打造高效的職場工作法

#AI人工智慧#學習#競爭力

2023/12/26

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News