AI 已達專家水準?OpenAI 用 GDPval 模型來衡量 AI 經濟價值

更新 發佈閱讀 6 分鐘

(本文所有數據與聲明均來自 OpenAI 於 2025 年 9 月發布的 GDPval 基準測試報告)

人工智慧的浪潮正以前所未有的速度席捲全球職場。2025 年 9 月 24 日,OpenAI 投下了一枚震撼彈, AI 模型在知識類型中 44 種不同職業領域的表現與能力上,已與人類專家十分接近。這項驚人的結論,源自其最新發布的「GDPval」基準測試,這是一個Open AI 未來將使用來衡量 AI 在真實世界工作任務中經濟價值的全新評估框架

OpenAI官方GDPval評估基準共列出了44個專業職業,分屬美國GDP主要九大產業,這些職業大致以知識型(非勞務型)工作為主,經過專家審核挑選。

完整44個職業如下:

這不只是一次學術性的演算法競賽,而是 AI 直接挑戰各行各業專業能力的實戰演練。然而,有趣的是,在這場由 OpenAI 主辦的競賽中,拔得頭籌的並非自家的模型。

GDPval 基準測試報告OpenAI網站連結GDPval 基準測試報告連結

GDPval 測試揭露了什麼?

Claude Opus 4.1 意外領先

GDPval 框架是 OpenAI 迄今為止衡量 AI 經濟價值最大膽的嘗試。它涵蓋了對美國國內生產總值(GDP貢獻最大的九大行業,從軟體開發、法律、護理到財務顧問,共計 1,320 項真實的工作任務。

為了確保評估的公正性與真實性,OpenAI 邀請了平均擁有 14 年經驗的行業專家來設計任務,並擔任「裁判」,將 AI 生成的成果與人類專家的作品進行匿名比較。

評估結果出乎許多人意料:

  • Anthropic 的 Claude Opus 4.1 在與人類專家的比拼中,以高達 47.6% 的「贏或平局率」位居榜首,展現了卓越的綜合能力。
  • OpenAI 自家的 GPT-5 則以 38.8% 的分數緊隨其後,同樣證明了其強大的專業實力。

頂尖 AI 進步速度驚人且產出品質已接近人類專家

這些數據清晰地表明,現今的頂尖 AI 模型在處理複雜的專業任務時,其產出品質已能達到,甚至在近半數情況下不遜於經驗豐富的人類專家

更令人矚目的是 AI 的驚人進步速度:OpenAI 指出,2024 年春季發布的 GPT-4o 在此測試中僅獲得 13.7% 的成績,而僅僅一年多後,GPT-5 的表現便提升了近三倍。

GDPval 是未來衡量通用人工智慧目標進展的關鍵方式

OpenAI 研究員,同時也是此份報告的主要作者 Tejal Patwardhan 強調:「我們終於有方法可以衡量我們的模型在真實世界中的表現——不僅僅是在學術測試上——這是我們衡量邁向通用人工智慧(AGI)目標進展的關鍵方式。」

百倍速度、百倍效益:AI 帶來的生產力革命

除了品質上的逼近,AI 在效率上的優勢更是顛覆性的。根據 OpenAI 的報告,完成這些專業任務時,AI 模型比人類專家快上 100 倍,且成本僅為人類專家的百分之一(此處成本主要指 API 的費用與專家所需的時間成本)。

這意味著,過去需要一位律師花費數小時撰寫的法律文件,或是一位財務顧問分析數天的市場報告,現在 AI 可能在幾分鐘內就生成一份高品質的草稿。這不僅僅是效率的提升,而是一場徹底的生產力革命


身處浪潮之中,我們該如何保持競爭優勢?

面對如此強大的「新同事」,焦慮是難免的。當 AI 能以更低的成本、更快的速度完成我們工作中的核心任務時,我們作為專業人士的價值在哪裡?

答案是:回到個人,深化無法被輕易複製的人類特質

  1. 成為 AI 的「指揮家」,而非「演奏者」:未來的競爭優勢,不在於重複執行 AI 已經擅長的任務,而在於如何巧妙地運用 AI 這個強大的工具。學習如何提出正確的問題、精準地下達指令(Prompt Engineering),以及辨別、整合、優化 AI 的產出,將成為關鍵技能。你需要從一個任務的執行者,轉變為一個工作流程的設計師與指揮家。
  2. 深化「人類獨有」的軟技能:GDPval 測試的是可量化的專業任務,但一個完整的職業不僅於此。複雜的策略決策、跨部門的溝通協調、對人性的深刻洞察、建立信任的客戶關係以及真正的同理心,這些是目前 AI 難以企及的領域。在 AI 處理掉大部分的例行性事務後,這些軟技能的價值將會被前所未有地放大。
  3. 培養跨領域的整合能力:AI 能在單一領域達到專家級水準,但將不同領域的知識、經驗和洞見融會貫通,進行創造性的解構與重組,依然是人類的強項。法律人懂程式碼、醫師懂數據分析、行銷人懂心理學,這種「π型人才」將能利用 AI 作為槓桿,創造出單一技能專家無法企及的價值。
  4. 擁抱終身學習與快速適應:AI 的進化速度是以「月」甚至「週」為單位。過去的「一技之長」可能在短時間內就被 AI 取代。因此,保持開放的心態,持續學習新知識、新工具,並勇於跳出舒適圈去適應新的工作模式,將是未來職場的生存法則。

AI 的崛起並非終點,而是一個全新的起點;它將我們從重複性的勞動中解放出來,迫使我們去思考自身更深層次的價值;與其畏懼被取代,不如思考如何駕馭這股力量,讓自己成為在 AI 時代中,更具創造力、策略性與人性溫度的關鍵角色。



留言
avatar-img
留言分享你的想法!
avatar-img
維那思的異想世界
12會員
108內容數
這裡分享維那思的日常與異想
2025/09/30
AI學壞了?一輛Waymo自駕車看見警察臨檢,竟當場違規迴轉「烙跑」,讓警察攔下後超傻眼:駕駛座根本沒人!罰單該開給誰?這起荒謬的「躲貓貓」事件,不僅揭開AI可能正在偷偷學習人類駕駛的壞習慣,更凸顯了現行法律的巨大漏洞。當機器人犯法,我們的社會準備好了嗎?點擊深入了解這場科技與法規的奇妙對決。
Thumbnail
2025/09/30
AI學壞了?一輛Waymo自駕車看見警察臨檢,竟當場違規迴轉「烙跑」,讓警察攔下後超傻眼:駕駛座根本沒人!罰單該開給誰?這起荒謬的「躲貓貓」事件,不僅揭開AI可能正在偷偷學習人類駕駛的壞習慣,更凸顯了現行法律的巨大漏洞。當機器人犯法,我們的社會準備好了嗎?點擊深入了解這場科技與法規的奇妙對決。
Thumbnail
2025/09/27
想知道機器人會取代你的工作嗎?貝恩《2025 全球科技報告》揭示,儘管人形機器人備受矚目,未來十年內,它們將會像「波浪」般循序漸進地進入特定產業,而非直接走入家庭:深入分析機器人的發展路徑與挑戰,電池、操控仍是瓶頸。想了解這波科技浪潮對我們生活有何影響?這篇文章將為你解讀未來機器人趨勢!
Thumbnail
2025/09/27
想知道機器人會取代你的工作嗎?貝恩《2025 全球科技報告》揭示,儘管人形機器人備受矚目,未來十年內,它們將會像「波浪」般循序漸進地進入特定產業,而非直接走入家庭:深入分析機器人的發展路徑與挑戰,電池、操控仍是瓶頸。想了解這波科技浪潮對我們生活有何影響?這篇文章將為你解讀未來機器人趨勢!
Thumbnail
2025/09/25
一份來自《哈佛商業評論》的最新研究報告揭示了AI的隱形成本。40%的員工使用AI,卻導致每個月損失高達186美元的生產力。 你是否也遇過「ChatGPT就是這樣寫的」這種情況?這篇文章探討AI幻覺與盲目信任的危害,提供3個實用方法,教你如何有效核實AI內容,讓它真正成為你的助力,而不是團隊的絆腳石。
Thumbnail
2025/09/25
一份來自《哈佛商業評論》的最新研究報告揭示了AI的隱形成本。40%的員工使用AI,卻導致每個月損失高達186美元的生產力。 你是否也遇過「ChatGPT就是這樣寫的」這種情況?這篇文章探討AI幻覺與盲目信任的危害,提供3個實用方法,教你如何有效核實AI內容,讓它真正成為你的助力,而不是團隊的絆腳石。
Thumbnail
看更多
你可能也想看
Thumbnail
人工智能(AI)是當今最熱門的話題之一,它正在改變人類的生活方式和 工作方式。踏入2023年,隨著 OpenAl 推出 ChatGPT 震驚全球,以 AI技術的應用程序不斷湧現,顛覆了 我們過去對科技的認知。 今天Only Two 翁立兔分享了這篇,我真的覺得蠻好的 【一天一千字,進化每一次】不
Thumbnail
人工智能(AI)是當今最熱門的話題之一,它正在改變人類的生活方式和 工作方式。踏入2023年,隨著 OpenAl 推出 ChatGPT 震驚全球,以 AI技術的應用程序不斷湧現,顛覆了 我們過去對科技的認知。 今天Only Two 翁立兔分享了這篇,我真的覺得蠻好的 【一天一千字,進化每一次】不
Thumbnail
隨著AI技術的普及,瞭解AI工具的重要性。本文介紹AI工具的應用,分享最新的GPT-4o的功能和優勢,並提出AI與人類智慧相結合的見解。
Thumbnail
隨著AI技術的普及,瞭解AI工具的重要性。本文介紹AI工具的應用,分享最新的GPT-4o的功能和優勢,並提出AI與人類智慧相結合的見解。
Thumbnail
AI 的快速發展,顛覆了各個產業的發展,ChatGPT 的出現,加快了作家寫作的速度,加快了工程師寫程式的速度,世界正在快速的改變。許多人開始探究自己的工作會不會被 AI 取代,身為資料領域的工作者,我也開始在思考,當 AI 的能力不斷進化且遠遠超過人類時,在我的工作中有哪些任務交給 AI 會更
Thumbnail
AI 的快速發展,顛覆了各個產業的發展,ChatGPT 的出現,加快了作家寫作的速度,加快了工程師寫程式的速度,世界正在快速的改變。許多人開始探究自己的工作會不會被 AI 取代,身為資料領域的工作者,我也開始在思考,當 AI 的能力不斷進化且遠遠超過人類時,在我的工作中有哪些任務交給 AI 會更
Thumbnail
以下都是轉貼各方觀點,重點可以進一步看發表者跟回應者,我自己也有自身應用場景的murmur : 低利率環境可能回不去 科技掌握在大資金公司時代則是持續下去 工業時代引導一波人才需求 東方社會喜歡考試定生死 學校教育外還有補習班可以協助 既然AI工具隨處可得 培養厚植的各方素養與多元興趣
Thumbnail
以下都是轉貼各方觀點,重點可以進一步看發表者跟回應者,我自己也有自身應用場景的murmur : 低利率環境可能回不去 科技掌握在大資金公司時代則是持續下去 工業時代引導一波人才需求 東方社會喜歡考試定生死 學校教育外還有補習班可以協助 既然AI工具隨處可得 培養厚植的各方素養與多元興趣
Thumbnail
史丹佛大學的AI指數2024報告(2024 AI Index Report)歸納了10大重點: 人工智慧(AI 在某些任務上擊敗了人類,但並非在所有任務上都擊敗了人類。AI在許多方面已經超越了人類基準,包括圖像分類、視覺推理和英語理解方面的一些基準。。。。
Thumbnail
史丹佛大學的AI指數2024報告(2024 AI Index Report)歸納了10大重點: 人工智慧(AI 在某些任務上擊敗了人類,但並非在所有任務上都擊敗了人類。AI在許多方面已經超越了人類基準,包括圖像分類、視覺推理和英語理解方面的一些基準。。。。
Thumbnail
已經成真的AI生成文字、圖片、音樂、影片,以及接下來更多的AI運用場景,每一項都將對人類社會產生重大的影響:包括抽象的人心、文化、審美、親密關係,以及實質的就業、經濟、生活、生涯規劃等。 本文我會以大量使用、測試AI的經驗,輔以田野調查的經驗,詳細說明AI時代最應該培養的四項能力。
Thumbnail
已經成真的AI生成文字、圖片、音樂、影片,以及接下來更多的AI運用場景,每一項都將對人類社會產生重大的影響:包括抽象的人心、文化、審美、親密關係,以及實質的就業、經濟、生活、生涯規劃等。 本文我會以大量使用、測試AI的經驗,輔以田野調查的經驗,詳細說明AI時代最應該培養的四項能力。
Thumbnail
理由很簡單,就算 AI 和人一樣強大,比如貢獻值是 1,只需要一般人往上面加個 0.1,那麼你的成品就超過了 AI 的作品了⋯ 不懂 AI 的人會過時嗎,會被淘汰嗎? 可以說是又可以說不是⋯ 不懂 AI 的人的薪酬肯定被降低了,不過不等於會消失⋯ 就像很多人也不懂電腦的專業知識,比如連簡單的計
Thumbnail
理由很簡單,就算 AI 和人一樣強大,比如貢獻值是 1,只需要一般人往上面加個 0.1,那麼你的成品就超過了 AI 的作品了⋯ 不懂 AI 的人會過時嗎,會被淘汰嗎? 可以說是又可以說不是⋯ 不懂 AI 的人的薪酬肯定被降低了,不過不等於會消失⋯ 就像很多人也不懂電腦的專業知識,比如連簡單的計
Thumbnail
本文介紹了人工智慧的定義和發展,以及在醫療、金融、製造、交通、教育等領域的應用。探討了AI的優勢和挑戰,以及AI在未來社會中的角色。作者提出了對AI發展的個人觀點和建議,強調了謹慎發展AI並制定相關法律法規的重要性。
Thumbnail
本文介紹了人工智慧的定義和發展,以及在醫療、金融、製造、交通、教育等領域的應用。探討了AI的優勢和挑戰,以及AI在未來社會中的角色。作者提出了對AI發展的個人觀點和建議,強調了謹慎發展AI並制定相關法律法規的重要性。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News