在閱讀本文後,您將獲悉以下核心洞見:
- 解構「經濟原語」:理解 Anthropic 如何透過「任務複雜度」、「人類與 AI 技能」、「自主權」及「成功率」等基礎維度,將抽象的 AI 影響力轉化為可量化的經濟指標。
- 全球採納的地理圖譜:掌握高收入與低收入國家在 AI 用途上的本質差異——為何富裕地區傾向於「協作增強」,而新興市場則專注於「教育轉型」。
- 職業技能的「去留」變局:辨析 AI 如何導致特定職業(如旅遊代辦)的「去技能化」與其他職業(如物業管理)的「技能升級」,以及其對未來薪資結構的隱含影響。
- 生產力增長的現實校準:了解為何在考量「任務成功率」與「勞動瓶頸」後,AI 對宏觀生產力的貢獻估值會有所下修,但仍具備重返歷史巔峰的潛力。
- 人機互動的「鏡像效應」:洞察用戶提示詞(Prompt)的教育水平如何直接決定 AI 輸出的質量,進而確認人力資本在 AI 時代的決定性地位。
導言:AI 如何重塑經濟?
本報告引入了全新的 AI 使用度量標準,旨在為 2025 年 11 月(即 Opus 4.5 發布前夕)用戶與 Claude 的互動提供深度畫像。這些被稱為「原語」(primitives)的指標,是衡量 Claude 使用方式的基礎性、簡約化度量,由 Claude 針對匿名化的 Claude.ai 及第一方(1P)API 對話記錄進行特定提問而生成。這些原語涵蓋了與 AI 經濟影響相關的五個維度:用戶與 AI 的技能、任務複雜度、賦予 Claude 的自主程度、Claude 的成功率,以及用途(個人、教育或工作)。
結果揭示了顯著的地理差異、AI 任務跨度的現實估算,並為修正 Claude 的宏觀經濟影響評估提供了基礎。隨本報告發布的數據是迄今為止最全面的,涵蓋了五個新的 AI 使用維度、消費者與企業的使用狀況,以及 Claude.ai 在各個國家和地區的細分數據。
第一章:自上一份報告以來的變化
我們重新審視了 2025 年 9 月發布的經濟指數報告,發現:
- Claude 的使用仍集中在特定任務,多數與編碼相關儘管在 Claude.ai 中觀察到超過 3,000 種獨特的工作任務,但前 10 大最常見任務佔採樣對話的 24%,較上次報告略有增加。「增強模式」(Augmentation,即用戶學習、迭代任務或獲取回饋的對話)在 Claude.ai 的佔比升至略高於一半。相比之下,「自動化模式」在 1P API 流量中仍佔主導地位,反映了其程式化運行的特質。
- 全球使用狀況持續失衡,而美國各州趨於收斂美國、印度、日本、英國和韓國在 Claude.ai 的總體使用量上保持領先。在全球範圍內,採納程度的不均現象仍可由人均 GDP 得到充分解釋。在美國境內,勞動力結構發揮了關鍵作用,計算機與數學專業人士比例較高的州,其 Claude 使用量系統性地更高。
儘管仍存在顯著的集中度,但自上次報告以來,Claude 的使用在美國各州之間的分布明顯變得更加均勻。若此趨勢持續,人均使用量將在 2 至 5 年內在全國範圍內達成平等。
第二章:引入並分析新的經濟原語
我們討論了開發新經濟原語的動機,包括如何篩選、實操及其局限性。此外,我們提供證據表明,與外部基準相比,我們的原語準確捕捉了潛在用途模式的趨向。
- Claude 的使用隨採納率與收入提高而趨於多樣化雖然 Claude 最常見的用途是工作,但在人均 GDP 最低的國家,課程作業(coursework)的使用比例最高,而富裕國家則顯示出最高的個人使用率。這符合典型的採納曲線邏輯:低開發國家的早期採納者往往是具有特定高價值應用需求的技術用戶或學生;而成熟市場的使用則向休閒和個人目的擴散。
- Claude 能成功完成多數任務,但在最複雜任務上表現較弱我們發現 Claude 通常能成功完成交辦任務,且其回覆的教育水平往往與用戶的輸入相匹配。然而,Claude 在處理複雜任務時顯得吃力:隨著人類完成該任務所需時間的增加,Claude 的成功率隨之下降,這與衡量 AI 穩定執行長時程任務能力的知名評測結果一致。
- 考量成功率後,職業的 AI 暴露度呈現不同面貌我們利用成功率原語來更深入地了解職業對 AI 的暴露程度,通過結合任務覆蓋率、成功率以及任務在工作中的重要性,計算出 Claude 能夠勝任的職業份額。對於某些職業,如數據輸入員和資料庫架構師,Claude 在工作的多個環節中展現出熟練度。
- Claude 被用於比整體經濟更高技能的任務我們在 Claude 使用中觀察到的任務,通常比廣泛經濟活動中的任務需要更高的教育程度。如果假設 AI 輔助的任務在工人職責中的佔比縮減,那麼移除這些任務後留下的將是較低技能的工作。這種任務置換對白領工人的影響並不統一:對某些職業來說,它移除了最需技能的任務;對另一些職業則移除了技術含量最低的。
若失去 Claude 執行的這些任務,旅遊代辦(Travel agents)將經歷「去技能化」,因為複雜的規劃工作將讓位於常規的購票與收費;相比之下,物業經理(Property managers)則會經歷「技能升級」,因為簿記任務將讓位於契約談判與利益相關者管理。
第三章:Claude 的使用方式隨地理位置而異
- GDP 與人類教育預測了全球及美國境內的採納率在全球層面,人均 GDP 每增加 1%,人均 Claude 使用量增加 0.7%。人類教育程度(理解用戶提示詞所需的估算受教育年限)在國家與美國州級層面上均與 AUI(Anthropic AI 使用指數)呈正相關。
- 人類如何提示,Claude 就如何回應人類提示詞與 AI 回覆的教育水平幾乎完全相關(相關係數 $r > 0.92$)。這凸顯了技能的重要性,表明人類如何引導 AI 決定了其效能。
- 高收入與高使用率與更多的「增強模式」相關人均使用量較高的國家(通常也是人均收入較高的國家)表現出較低的自動化程度,賦予 Claude 的決策自主權也較少。換言之,高收入國家更多地將 AI 視為助理與合作者,而非讓其獨立運作。
第四章:任務與生產力
- 任務加速中的權衡複雜任務在 AI 輔助下能獲得更大的時間節省(加速比),但這以可靠性為代價。在 Claude.ai 中,需要高中程度的提示詞可獲得 9 倍加速,而大學程度則達到 12 倍。
- 現實使用中的任務跨度API 數據顯示,對於人類需花 3.5 小時完成的任務,Claude 的成功率約為 50%。而在 Claude.ai 中,由於多輪對話允許用戶修正方向,達到 50% 成功率的任務跨度可延伸至約 19 小時。
- 重新審視總體生產力影響我們之前估計 AI 的廣泛採納可使美國勞動力生產力每年成長 1.8 個百分點。在納入「任務成功率」這一原語進行修正後,Claude.ai 的數據隱含的年生產力成長修正為 1.2 個百分點,而 API 流量則為 1.0 個百分點。儘管有所下修,但若能持續十年,這仍能使美國生產力成長恢復到 90 年代末至 2000 年代初的高水準。
- 瓶頸任務(Bottleneck Tasks)如果某些任務是必不可少且難以被 AI 取代的(任務互補性),那麼整體的生產力提升將受到這些最難被 AI 加速的環節所制約。
結語
第四份 Anthropic 經濟指數報告引入了經濟原語,展現了消費者與企業使用 Claude 的基礎特徵。我們的發現表明,Claude 傾向於被用於需要較高教育程度的任務,並在此類任務中提供更大的生產力提振。如果這些任務從人類工作中消失,可能會產生「去技能化」效應。然而,這取決於任務間的互補性,以及生產力提高是否會增加對該任務的需求。
隨着 AI 能力的進步,Claude 的成功率可能提高,使用模式可能展現更高的自主權。我們將持續追蹤這些動態,提供 AI 在經濟中角色的縱向觀察


