付費限定

YC AI Startup School:軟體 3.0 時代、追求有用哲學、人形機器人的未來

更新於 發佈於 閱讀時間約 31 分鐘

Hi 我是 VK~

兩周前,美國知名加速器 Y Combinator 首次舉辦 AI Startup School,找來了前特斯拉 AI 總監 Andrej Karpathy 分享軟體發展的三個時代、特斯拉和 SpaceX 執行長 Elon Musk 暢談創業哲學與 AGI 未來,以及 OpenAI 執行長 Sam Altman、微軟執行長 Satya Nadella、李飛飛和吳恩達等人。

目前 YC 的 Youtube 頻道陸續上架了四支影片,最近看完後發現有蠻多值得關注的細節,之中帶給我的延伸想法。這期來聊四位如何從不同角度看待同一個 AI 時代的機會與挑戰。

這期電子報會有:

  • 前特斯拉 AI 總監 Andrej Karpathy:軟體第三次革命
  • 特斯拉和 SpaceX 執行長 Elon Musk:追求有用、解決真實問題🔒
  • OpenAI 執行長 Sam Altman:走向 AI 伴侶、人形機器人的未來🔒
  • 微軟執行長 Satya Nadella:AI 時代的平台思維🔒

喜歡這期的內容,歡迎分享給朋友一起訂閱《VK科技閱讀時間》,祝你今天一切順利~


前特斯拉 AI 總監 Andrej Karpathy:軟體第三次革命

前特斯拉 AI 總監、OpenAI 共同創辦人 Andrej Karpathy 在 AI Startup School 的演講,他用「Software is Chaning (again)」為題,討論了我們正處於軟體發展史上的關鍵轉折點。(fun fact:題目後面括弧「again」,是因為他過去提出軟體 2.0 的概念,現在他提出軟體 3.0)

在 Karpathy 的分享中,帶給我最更多想法的是他對於 AI 時代產品設計的思考。不同於大家對於 AI Agent 的狂熱,提出更實際、更具可操作性的產品策略,無論是否要打造 AI 產品,我想都可以從中會對於如何和 AI 協作有更具體的想法。

他認為,軟體正在經歷三個截然不同的發展階段,每次變革都改變了我們與電腦互動的根本方式:

  • 軟體 1.0:傳統程式的時代

軟體 1.0 是大家相對熟悉的軟體開發方式。工程師用 Python、C++ 等語言,一行一行地寫出明確的指令給電腦執行。這種方式已經存在 70 年,這需要花費 5-10 年學習,才能真正掌握軟體開發技能。Karpathy 以特斯拉 Autopilot 為例:早期的自動駕駛系統充滿大量的 C++ 程式碼,工程師需要明確告訴車子如何識別物體、如何轉彎、如何做決策。

  • 軟體 2.0:神經網路權重時代

這是 Karpathy 在 2017 年提出的概念。他在著名文章〈Software 2.0〉中提到,軟體 2.0 是用更抽象、對人類不友善的語言寫成的,比如神經網路的權重。沒有人類參與編寫這些程式碼,因為權重數量龐大(典型的網路可能有數百萬個參數),直接用權重寫程式相當困難。

最經典的案例是 Tesla Autopilot 系統的演進。在 FSD Beta v12 更新中,Tesla 將城市街道駕駛控制棧轉換為單一端到端神經網路,替換了超過 30 萬行的明確 C++ 程式碼。 Karpathy 曾描述這個過程:「在 Tesla Autopilot 系統中,神經網路逐步『吃掉』了傳統的 C++ 程式碼」。

  • 軟體 3.0:自然語言程式設計時代

這是 Karpathy 在最新演講中提出的最新概念。大型語言模型讓神經網路變成可程式設計的電腦,而程式就是用英文寫成的 prompts。「現在如果你看 GitHub,程式碼不再只是程式碼了,有很多英文與程式交織在一起,所以我認為有一個日益增長的新程式碼類別。」這個轉變最神奇的地方在於:「我們現在用英文來程式設計電腦。」

這樣的演變不是後者取代前者,而是不同階段的軟體都有它的優缺點。他也對身為想要在 AI 時代創業的人,最好的方式精通這三種不同典範間的軟體,當遇到哪些問題才知道最合適的解法是什麼。

AI 時代產品的四大核心元素

到了軟體 3.0 的時代,打造 AI 產品又需要具備哪些元素?Karpathy 分析現在成功的 AI 產品,像是 Cursor、Perplexity 等,可以歸結四點:

1. 上下文管理(Context Management)LLM 能夠自動處理大量的上下文資訊,這是傳統軟體難以做到的。以 Cursor 為例,它能理解你的整個程式碼庫,而不需要你每次都重新解釋背景。

2. 多模型協調(Multiple LLM Orchestration) 現代 AI 產品通常不是依賴單一模型,而是在背景協調多個專門的模型。Cursor 就同時使用了嵌入模型處理檔案、聊天模型進行對話、以及專門的模型來應用程式碼。

3. 應用專屬的圖形介面(Application-specific GUI)這點特別重要。Karpathy 強調,「你不會想要直接與作業系統用文字對話」,因為純文字介面難以閱讀和理解。專門設計的 GUI 能讓人類快速審查 AI 的工作成果。比如 Cursor 顯示程式碼差異的紅綠對比,讓你一眼就能看出改動,遠比純文字描述來得有效。

4. 自主性滑桿(Autonomy Slider)這是最關鍵的設計概念。產品應該讓使用者根據任務複雜度調整 AI 的自主程度。在 Cursor 中,你可以選擇簡單的 tab 補全、修改特定程式碼區塊,或是讓 AI 處理整個檔案,甚至整個專案。

專注打造 Partial Autonomy 的產品

如果這場演講有個副標大概會是「為什麼現在是 Partial Autonomy 而非 Full Agent 的時代?」在接下來 Karpathy 反覆提到 Autonomy Slider 的概念,這是走向全面的 AI agent 之前的過渡時期。

他回憶起 2013 年第一次搭乘 Waymo 自動駕駛車的經歷:「30 分鐘的車程完美無瑕,零干預。當時我以為自動駕駛即將到來。」但 12 年過去,自動駕駛仍在開發中,即使是看起來無人的 Waymo,背後仍有大量人工介入和遠端操作。

「當我看到『2025 是 Agent 之年』這樣的說法時,我會很擔心。我覺得這應該是『Agent 的十年』,而且我們需要人類保持在迴路中,需要謹慎行事。」

這也是為什麼 Karpathy 認為,與其在現在討論直接打造一個「鋼鐵人機器人」,不如專注在打造可以增強人類(augmentation)的 「鋼鐵人盔甲」。

以現階段來說,AI 幾乎可以做到超越人類的能力,但免不了還是會有些幻覺的地方。隨著時間推移,我們可以想像 AI 的能力會越來越好,就像最常聽到的討論,你現在看到的 AI 模型是你此生中看過最糟的。

這個自主性滑桿會隨著時間、逐漸向右移動,讓 AI 承擔更多責任。在當前 AI 技術仍有局限性的情況下,與其追求炫目的自主 Agent 展示,不如專注於打造 Partial Autonomy 產品,現階段 Partial Autonomy 產品有幾個關鍵優勢:

  • 可控性:使用者始終保持對最終結果的控制權
  • 可信度:每個步驟都可以被審查和調整
  • 實用性:即使 AI 能力有限,仍能提供實質幫助
  • 學習性:人類和 AI 可以在互動中持續改進

AI Generation + Human Verification:加速產品開發的組合技

Karpathy 觀察到,目前最有效和 AI 協作模式是「AI 負責生成,人類負責驗證」,要讓這個循環儘可能快速運轉,有兩個可以調整的方向:

第一,加速人類驗證過程:設計驗證友善的輸出格式。所有 AI 的輸出都應該考慮人類驗證的便利性,這可能意味著結構化的呈現、清楚的標記,或是互動式的介面。比如說,以程式開發為例,與其讓 AI 用文字描述改動,不如直接顯示程式的紅綠差異對比。這讓人類能快速掃描並理解變更,大幅提升驗證速度。

對這點蠻有感的,大多數時候我還是和內容打交道。在把想看的資料丟進 NotebookLM 後,雖然不算是驗證的過程;第一步總是會點選生成心智圖,讓我對不熟悉的內容,可以有個快速的了解;接著,第二步,會點選心智圖中我有興趣的「子主題」。(這點反過來做也可以,如果和 AI 協作寫完一筆記,也可以放進 NotebookLM 生成心智圖驗證邏輯概念等)

之前被問到一個問題蠻有趣的:NotebookLM 和 Gemini 的差異在哪裡?畢竟只是介面不太一樣,但兩者使用到的模型是相同的。我記得當時的回答是:前者在整個使用者介面上,可以提供我在閱讀和研究上更好的體驗。

更好的體驗就是盡量減少在 AI 迷路的可能性。因為當今天想要研究新領域,打開 Gemini、Claude 等,它的設計主要是透過文字回答,然後不斷地線性往下,這很容易發生迷路的問題;NotebookLM 的心智圖幾乎會在我每次快要/已經迷路的狀態,讓我知道說接下來要再問什麼。

第二,讓 AI 在控制範圍內:避免過度自主。在這裡需要讓 AI 盡可能提升它可以通過人類成功驗證的機率。Karpathy 提到要給 AI 套上韁繩:「如果你想要完成實際工作,過度反應的 agent 就不是那麼棒了。」

他在自己的工作中總是害怕得到太大的程式碼差異,寧願採用小增量的方式,確保每一步都能被理解和驗證。除此之外,模糊的提示會導致 AI 偏離預期,進而增加驗證失敗的機率。所以花點時間撰寫具體明確的 prompt,可以大幅提高驗證成功率。

Karpathy 在演講中推薦這篇文章,可以如何和 AI 更好協作,像是提供更多背景資訊、拆解問題,當問題越具體,AI 表現得越好,以及可以建立詳細的文件,這件事透過 LLM 來做會變得更輕鬆。

這也可以帶到他最後:為 AI 原生的世界做準備。想像一下,如果你的網站不只要服務人類用戶,還要服務 AI「用戶」,會是什麼樣子?

Karpathy 提到了幾個正在發生的變化:

  • robots.txt 的 AI 版本:就像我們現在有 robots.txt 來指導網路爬蟲,未來可能需要 llm.txt 來告訴 AI 這個域名是關於什麼的。
  • 文件的 AI 化:Vercel 和 Stripe 已經開始提供專門給 LLM 閱讀的 Markdown 格式文件。為什麼?因為對 AI 來說,讀取 HTML 既困難又容易出錯,Markdown 則簡潔明瞭。
  • 消除「點擊」指令:任何文件中出現「點擊這個」的地方,對 AI 來說都是障礙。Vercel 的解決方案是把每個「點擊」操作都替換成等效的 curl 命令,讓 AI 能夠直接執行。

他講了一個很有趣的案例:Manim 是由數學教育 YouTube 頻道 3Blue1Brown 的創作者 Grant Sanderson 開發的。這頻道都會透過 Manim 製作精美的數學概念動畫,涵蓋線性代數、微積分、神經網路等主題。

「有天我想要自己做一個動畫。Manim 有詳盡的使用文件,但他不想真的去讀完它,所以我把整個文件複製貼給 LLM,描述了他想要的效果,結果它直接就能運作,LLM 直接幫我 vibe code 了一個完全符合我需求的動畫。」這是 Karpathy 想強調的,我們正在從服務人類的數位世界,轉向一個人類與 AI 共存的混合世界。

私心很推薦可以花 40 分鐘看完整個演講,或許會有不同想法。一個我常用判斷好內容的方法是能否帶給我新的想法和行動。然後在看 Karpathy 這部中間暫停很多次,想一下他講的話,更多是記下他不經意在簡報中提到的內容(前面的文章、用 Python 寫的動畫庫 Manim,而且他是唯一有用簡報的講者,非常有收穫!

Elon Musk:追求有用、解決真實問題

以行動支持創作者!付費即可解鎖
本篇內容共 12378 字、1 則留言,僅發佈於VK科技閱讀時間你目前無法檢視以下內容,可能因為尚未登入,或沒有該房間的查看權限。
留言
avatar-img
留言分享你的想法!
avatar-img
VK科技閱讀時間
32.2K會員
98內容數
Hi,我是 VK~ 好奇科技發展、想看懂科技趨勢和新創的眉角。決定每週記錄下那些我感興趣、還看不懂的事。這裡會聊很多科技公司、新創,他們背後的人物與故事。
VK科技閱讀時間的其他內容
2025/06/16
Hi 我是 VK~ 過去兩年多,一直有傳聞前蘋果首席設計師 Jony Ive 和 OpenAI 執行長 Sam Altman 討論開發以 OpenAI 技術為核心的消費性產品。 這件事直到上個月才有了明朗的消息,也就是 OpenAI 收購 Ive 的 io 團隊,接下來會聯手打造 AI 硬體設備
Thumbnail
2025/06/16
Hi 我是 VK~ 過去兩年多,一直有傳聞前蘋果首席設計師 Jony Ive 和 OpenAI 執行長 Sam Altman 討論開發以 OpenAI 技術為核心的消費性產品。 這件事直到上個月才有了明朗的消息,也就是 OpenAI 收購 Ive 的 io 團隊,接下來會聯手打造 AI 硬體設備
Thumbnail
2025/04/28
Hi 我是 VK~ 「如果我要做到第四種運氣,也就是獨特性格/角色帶來的運氣(Luck from your unique character,你是某領域的佼佼者,當機會出現,它會直接找你,因為只有你能做這件事),那我就要開始做個人品牌嗎?」 有天,上次在 Podcast 跟我們聊 Wiz 的朋友
Thumbnail
2025/04/28
Hi 我是 VK~ 「如果我要做到第四種運氣,也就是獨特性格/角色帶來的運氣(Luck from your unique character,你是某領域的佼佼者,當機會出現,它會直接找你,因為只有你能做這件事),那我就要開始做個人品牌嗎?」 有天,上次在 Podcast 跟我們聊 Wiz 的朋友
Thumbnail
2025/03/03
Hi 我是 VK~ 過去介紹過幾次科技公司共同創辦人的傳記,有創辦人自己寫的《張忠謀自傳》,或是很不像自傳體的《創建之道》,或是請傳記作家 Walter Isaacson 幫忙撰寫的《馬斯克傳》都討論過。隨著介紹的次數越多,也深深感受到這些故事背後極具獨特、難以複製的特性。 大概在半年到一年前,
Thumbnail
2025/03/03
Hi 我是 VK~ 過去介紹過幾次科技公司共同創辦人的傳記,有創辦人自己寫的《張忠謀自傳》,或是很不像自傳體的《創建之道》,或是請傳記作家 Walter Isaacson 幫忙撰寫的《馬斯克傳》都討論過。隨著介紹的次數越多,也深深感受到這些故事背後極具獨特、難以複製的特性。 大概在半年到一年前,
Thumbnail
看更多
你可能也想看
Thumbnail
再次參加了前東家 ALPHA Camp 的線上講座。 這次是與 iKala 的 Sega,以及 The Z Institute & FansNetwork 的李婷婷合作。 內容主要是談 AI 在陪伴經濟相關的應用與可能創造的商機,以及如何思考延伸的影響與可能。
Thumbnail
再次參加了前東家 ALPHA Camp 的線上講座。 這次是與 iKala 的 Sega,以及 The Z Institute & FansNetwork 的李婷婷合作。 內容主要是談 AI 在陪伴經濟相關的應用與可能創造的商機,以及如何思考延伸的影響與可能。
Thumbnail
今天參加了前東家 ALPHA Camp 與 Yourator、職游合作的線上講座,內容主要是談 AI 時代對於招募、職涯選擇、技能發展的影響,並從對於人才與就業市場的觀察、求職者與企業的互動、企業所重視的能力與特質這三面向來進行討論。 做了筆記,把五個特別有感的重點與大家分享,同時也補充自己的觀點
Thumbnail
今天參加了前東家 ALPHA Camp 與 Yourator、職游合作的線上講座,內容主要是談 AI 時代對於招募、職涯選擇、技能發展的影響,並從對於人才與就業市場的觀察、求職者與企業的互動、企業所重視的能力與特質這三面向來進行討論。 做了筆記,把五個特別有感的重點與大家分享,同時也補充自己的觀點
Thumbnail
Hi 我是 VK~ 這期來介紹美國新創加速器 Y Combinator 最新一梯(W24),他們收了哪些新創團隊?這些團隊正在做的題目是什麼? 喜歡這期的內容,歡迎分享給朋友一起訂閱《VK 科技閱讀時間》,祝你今天一切順利~ YC 基本上可以說是矽谷新創搖籃的代名詞。Airbnb、Strip
Thumbnail
Hi 我是 VK~ 這期來介紹美國新創加速器 Y Combinator 最新一梯(W24),他們收了哪些新創團隊?這些團隊正在做的題目是什麼? 喜歡這期的內容,歡迎分享給朋友一起訂閱《VK 科技閱讀時間》,祝你今天一切順利~ YC 基本上可以說是矽谷新創搖籃的代名詞。Airbnb、Strip
Thumbnail
去年也說明過了,就是機器人的產業崛起想像 我們目前頂多習慣LEVEL 2~3 而下一個等級是系統全自動,這需要更多的法規還有硬體+軟體進步 我還是跟2020年看法一樣.電動車2025年群雄割據結束後,就會邁入下一個階段 之後就是軟體也會開始有成長期空間 2020年說要先硬體普及後才能開
Thumbnail
去年也說明過了,就是機器人的產業崛起想像 我們目前頂多習慣LEVEL 2~3 而下一個等級是系統全自動,這需要更多的法規還有硬體+軟體進步 我還是跟2020年看法一樣.電動車2025年群雄割據結束後,就會邁入下一個階段 之後就是軟體也會開始有成長期空間 2020年說要先硬體普及後才能開
Thumbnail
人工智慧(AI)發展一日千里,年初OpenAI的Sora,三月初Anthropic的Cloude3,都為未來科技的創想帶來震撼。Elon Musk的X AI公司將他們的大型語言模型Grok-1開源,不僅展現了對AI技術開放共享的承諾,也預示著行業未來可能也會有不同於資本競爭、算力對抗的新發展方向。
Thumbnail
人工智慧(AI)發展一日千里,年初OpenAI的Sora,三月初Anthropic的Cloude3,都為未來科技的創想帶來震撼。Elon Musk的X AI公司將他們的大型語言模型Grok-1開源,不僅展現了對AI技術開放共享的承諾,也預示著行業未來可能也會有不同於資本競爭、算力對抗的新發展方向。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
- 台印度簽MOU 移工來源國+1|工商時報 - ASML 超越應材,成全球最大晶圓廠設備製造商|科技新報 - OpenAI推「文字生成影音」 包含複雜場景、特定動作等正確細節|經濟日報 - Satya Nadella 任微軟 CEO 十周年,他做對哪 4 件事讓公司市值翻 10 倍?|INSIDE
Thumbnail
- 台印度簽MOU 移工來源國+1|工商時報 - ASML 超越應材,成全球最大晶圓廠設備製造商|科技新報 - OpenAI推「文字生成影音」 包含複雜場景、特定動作等正確細節|經濟日報 - Satya Nadella 任微軟 CEO 十周年,他做對哪 4 件事讓公司市值翻 10 倍?|INSIDE
Thumbnail
‌‌‌🔥🔥🔥🔥🔥🔥‌‌【AI智能媒體品牌行銷-免費入門實戰班3.0】 🈵🈵🈵🈵🈵🔥免費課程!場場爆滿!緊急再加開六場!開始報名囉! 📌你知道!你未來的競爭對手不是人嗎? 📌你知道!你未來的工作將會被取代嗎?未來是一個人人都必需-與AI攜手的新世代!無論你身處哪一種產業-都
Thumbnail
‌‌‌🔥🔥🔥🔥🔥🔥‌‌【AI智能媒體品牌行銷-免費入門實戰班3.0】 🈵🈵🈵🈵🈵🔥免費課程!場場爆滿!緊急再加開六場!開始報名囉! 📌你知道!你未來的競爭對手不是人嗎? 📌你知道!你未來的工作將會被取代嗎?未來是一個人人都必需-與AI攜手的新世代!無論你身處哪一種產業-都
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News