探索軟體變革與人類-AI協作:Andrej Karpathy談Software 3.0與LLM的未來

更新於 發佈於 閱讀時間約 5 分鐘

Andrej Karpathy 在 Y Combinator AI Startup School 的演講中,再次說明之前提及的軟體開發第三次革命「Software 3.0」。Karpathy認為,大型語言模型(LLM)不僅是工具,更像是一個新興的作業系統,徹底改變程式設計方式與人類 - AI 協作模式。TN科技筆記將整理演講中的重要觀點,推薦讀者有空可以觀看影片其他精彩內容。


Andrej Karpathy: Software Is Changing (Again)

軟體演進:從1.0到3.0的轉型

Andrej Karpathy 將軟體演進分為三階段:Software 1.0(傳統程式碼)、Software 2.0(神經網路權重)與Software 3.0(大型語言模型與自然語言提示):

  • Software 1.0:以 Python 、 C++ 等語言編寫明確指令,仰賴程式設計師的邏輯能力。
  • Software 2.0:以神經網路為核心,透過資料集訓練與優化器生成模型參數,例如圖像識別模型 AlexNet 或生成模型 Flux 。以特斯拉 Autopilot 為例,說明神經網路如何逐步取代傳統程式碼。
  • Software 3.0:以大型語言模型為基礎,程式設計從程式碼轉向自然語言提示詞(prompt)。例如,情感分析任務在1.0時代需撰寫複雜演算法,2.0時代訓練神經網路,而3.0時代僅需一句話提示大型語言模型即可完成。這一轉變讓程式設計更直觀,降低進入門檻,使非技術背景者也能參與軟體創作。

大型語言模型的心理學:人類心靈的模擬與缺陷

Andrej Karpathy 將大型語言模型形容為「人類心靈的隨機模擬」,其能力來自於網際網路文本訓練,具備百科全書般的記憶力,卻也存在認知缺陷:

  • 超能力:大型語言模型能記憶大量資訊,類似電影《雨人》中超強記憶力的角色。
  • 缺陷:包括幻覺(生成錯誤資訊,如誤判9.11 > 9.9)、鋸齒狀智慧(某些任務表現超群,某些卻犯低級錯誤)以及順行性遺忘症(無法像人類般累積經驗,上下文視窗即其工作記憶)。這些特性要求人類在與LLM協作時保持監督與驗證。

部分自主性應用:人類與 AI 的協同設計

Andrej Karpathy 強調當前大型語言模型的應用應專注於部分自主性,而非完全自主代理。他以程式設計工具 Cursor 為例,說明成功的大型語言模型應用需具備以下特點:

  • 上下文管理:有效處理大量資料。
  • 多模型協調:整合嵌入模型、聊天模型等。
  • 專屬GUI:提供直觀介面,讓人類快速審核AI生成內容。
  • 自主性滑塊 (Autonomy Slider):允許使用者依任務需求調整 AI 自主程度,從簡單自動完成到全面程式碼生成。

他再以特斯拉的 Autopilot 為例,說明部分自主性產品需人類監督,並透過GUI加速驗證過程。Karpathy 建議,現階段應打造如「鋼鐵人套裝」的增強工具,而非完全自主的「鋼鐵人機器人」。

人類 - AI 協作循環:生成與驗證的關鍵

人類與AI的協作核心在於生成-驗證循環。AI 負責生成內容,人類負責驗證正確性,目標是讓這一循環快速且高效。Karpathy 提出兩大策略:

  • 加速驗證:透過直觀的GUI(如程式碼差異的紅綠顯示)提升審核效率。
  • 控制 AI:避免 AI 生成過於複雜的輸出,確保人類能輕鬆監督。例如,在教育應用中,教師可先審核 AI 生成的課程內容,確保其符合教學目標,從而「控制 AI 」於特定範圍內。

Software 3.0的到來代表軟體開發的民主化與人類 - AI 協作的新篇章。Andrej Karpathy 的完整演講也涵蓋更多精彩內容的洞見,不僅說明未來大型語言模型的潛力與局限,也為設計部分自主性應用提供了實務指引,推薦各位讀者觀看原影片!

我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~~~也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!>>>>> 請我喝一杯咖啡

在此也感謝每個月持續請我喝杯咖啡的讀者們,讓我更加有動力為各位帶來科技新知!


留言
avatar-img
留言分享你的想法!
avatar-img
TN科技筆記(TechNotes)的沙龍
32會員
126內容數
大家好,我是TN,喜歡分享科技領域相關資訊,希望各位不吝支持與交流!
2025/06/20
Midjourney 於 2025 年 6 月 19 日正式推出其首款 AI 影片生成模型——V1 影片模型。這款模型不僅延續了 Midjourney 在圖像生成領域的表現,更將創意推向動態影片創作領域。TN科技筆記接下來將會介紹 V1 影片模型的功能、特色與應用。
Thumbnail
2025/06/20
Midjourney 於 2025 年 6 月 19 日正式推出其首款 AI 影片生成模型——V1 影片模型。這款模型不僅延續了 Midjourney 在圖像生成領域的表現,更將創意推向動態影片創作領域。TN科技筆記接下來將會介紹 V1 影片模型的功能、特色與應用。
Thumbnail
2025/06/19
Google 於 2025 年 6 月 17 日宣布 Gemini 2.5 系列模型的最新更新,涵蓋 Gemini 2.5 Pro、Flash 及全新推出的 Flash-Lite 模型。TN科技筆記將帶各位介紹 Gemini 2.5 系列模型本次更新的重點。
Thumbnail
2025/06/19
Google 於 2025 年 6 月 17 日宣布 Gemini 2.5 系列模型的最新更新,涵蓋 Gemini 2.5 Pro、Flash 及全新推出的 Flash-Lite 模型。TN科技筆記將帶各位介紹 Gemini 2.5 系列模型本次更新的重點。
Thumbnail
2025/06/14
OpenAI 執行長 Sam Altman 在2025年6月11日的部落格文章《The Gentle Singularity》(溫和奇點)中,提出了對 AI 未來發展的深刻洞見。TN科技筆記將部落格文章中的核心觀點,結合當前 AI 趨勢,幫助讀者理解 AI 奇點的潛力與挑戰。
Thumbnail
2025/06/14
OpenAI 執行長 Sam Altman 在2025年6月11日的部落格文章《The Gentle Singularity》(溫和奇點)中,提出了對 AI 未來發展的深刻洞見。TN科技筆記將部落格文章中的核心觀點,結合當前 AI 趨勢,幫助讀者理解 AI 奇點的潛力與挑戰。
Thumbnail
看更多
你可能也想看
Thumbnail
在當今快速發展的技術時代,人工智能 Artificial Intelligence 和機器學習 Machine Learning 已成為推動業務創新和增長的重要力量。從改善客戶服務到優化運營流程,AI和ML的應用範圍日益廣泛,為企業創造出前所未有的機會。企業又可如何利用AI和ML提升業務呢?
Thumbnail
在當今快速發展的技術時代,人工智能 Artificial Intelligence 和機器學習 Machine Learning 已成為推動業務創新和增長的重要力量。從改善客戶服務到優化運營流程,AI和ML的應用範圍日益廣泛,為企業創造出前所未有的機會。企業又可如何利用AI和ML提升業務呢?
Thumbnail
本篇文章為您整理了最新的人工智慧熱點新聞摘要,包括Anthropic的Claude 3.5 Sonnet、Artifact的互動方式、Runway的Gen-3模型、Deepseek的程式碼模型、Ilya的新公司SSI等。
Thumbnail
本篇文章為您整理了最新的人工智慧熱點新聞摘要,包括Anthropic的Claude 3.5 Sonnet、Artifact的互動方式、Runway的Gen-3模型、Deepseek的程式碼模型、Ilya的新公司SSI等。
Thumbnail
隨著ChatGPT問世以來,AI持續在不同領域上發揮作用。虛擬人已能代理人類完成特定任務,是新興科技從工具擴展至落地應用服務的關鍵產物。 透過觀察AI如何賦能Web3的發展,以及觀測各種國際創新應用案例,請參加此免費研討會,了解「虛擬人應用發展趨勢」和「從AI賦能Web3新興應用看發展趨勢」二個議題
Thumbnail
隨著ChatGPT問世以來,AI持續在不同領域上發揮作用。虛擬人已能代理人類完成特定任務,是新興科技從工具擴展至落地應用服務的關鍵產物。 透過觀察AI如何賦能Web3的發展,以及觀測各種國際創新應用案例,請參加此免費研討會,了解「虛擬人應用發展趨勢」和「從AI賦能Web3新興應用看發展趨勢」二個議題
Thumbnail
人工智慧系統正在慢慢影響我們的生活,並在不同的產業和產品中得到應用。目前使用的系統大多是基於狹義人工智慧。狹義人工智慧與通用人工智慧有很大不同。 狹義人工智慧的創建是為了專注於特定任務,一個例子就是聊天機器人。
Thumbnail
人工智慧系統正在慢慢影響我們的生活,並在不同的產業和產品中得到應用。目前使用的系統大多是基於狹義人工智慧。狹義人工智慧與通用人工智慧有很大不同。 狹義人工智慧的創建是為了專注於特定任務,一個例子就是聊天機器人。
Thumbnail
AI工具導入會是第四次工業革命的開始,對日後的工作機會和型態產生根本性的變化,本文分成3大部分各別討論: (1)文科生將再次迎來出頭天;(2)理工科學生工作機會將大幅減少;(3)一人公司數量將爆發性成長。
Thumbnail
AI工具導入會是第四次工業革命的開始,對日後的工作機會和型態產生根本性的變化,本文分成3大部分各別討論: (1)文科生將再次迎來出頭天;(2)理工科學生工作機會將大幅減少;(3)一人公司數量將爆發性成長。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
大型語言模型 (LLM) 在最近幾年取得了重大進展,並引起了人們對生成式AI將如何影響工作方式的廣泛重視。雖然 LLM 具有強大的文本生成、翻譯和理解能力,但它們對工作的影響仍然是一個複雜且充滿爭議的話題。 本文摘要自MIT 史隆管理評論,分析LLM 對工作帶來的影響。
Thumbnail
大型語言模型 (LLM) 在最近幾年取得了重大進展,並引起了人們對生成式AI將如何影響工作方式的廣泛重視。雖然 LLM 具有強大的文本生成、翻譯和理解能力,但它們對工作的影響仍然是一個複雜且充滿爭議的話題。 本文摘要自MIT 史隆管理評論,分析LLM 對工作帶來的影響。
Thumbnail
本文將探討人工智能對生活上的影響和改變,同時,例如規劃時間,安排選擇等等,附上一些建議與推薦工具。 在今天,大語言模型開通全球,我們可以輕易的使用人工智能對話,和他們對話,交流,討論,但是,除了娛樂以外,在生活上,我們還有什麼用法呢?
Thumbnail
本文將探討人工智能對生活上的影響和改變,同時,例如規劃時間,安排選擇等等,附上一些建議與推薦工具。 在今天,大語言模型開通全球,我們可以輕易的使用人工智能對話,和他們對話,交流,討論,但是,除了娛樂以外,在生活上,我們還有什麼用法呢?
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News