一、 前言:一場關乎人類未來的賭注
這部紀錄片《The Thinking Game》不僅僅是一家科技公司的創業史,它記錄了人類試圖複製自身最神秘特質——「智慧」的過程。DeepMind 創辦人 Demis Hassabis 在白板上寫下的兩行使命:「第一步:解開智慧之謎;第二步:用它解決一切問題」,在當時看來狂妄至極,但影片展現了他們如何用十年時間,將這句狂言變成了預言。看完這部片,我最深的感觸是:我們正處於人類文明「操作系統」升級的前夜。
二、 核心洞察(三個維度)
1. 策略維度:用「遊戲」作為通往「真理」的跳板 DeepMind 的成功路徑非常獨特且反直覺。他們沒有一開始就去攻克癌症或氣候變遷,而是選擇了 Atari 遊戲、圍棋和星海爭霸。 這展現了一種極致的「降維打擊」思維。遊戲提供了完美的訓練場——數據量大、回饋即時、失敗成本低。透過在虛擬世界中訓練出通用的學習演算法(General Purpose Algorithm),他們實際上是在打造一把「萬能鑰匙」。當這把鑰匙(AlphaFold)最終插入生物學這扇沉重的大門時,困擾科學家 50 年的蛋白質摺疊難題應聲而解。這告訴我們:解決最困難的問題,往往需要先退後一步,尋找底層的通用解法。
2. 哲學維度:重新定義「創造力」與人類的謙卑 影片中最震撼人心的一幕,莫過於 AlphaGo 對戰李世乭的第二局「第 37 手」。那一步棋被人類專家評為「只有神或惡魔才能下出的一手」。 過去我們認為,計算是機器的強項,而「直覺」和「創造力」是人類最後的堡壘。但那一刻,堡壘崩塌了。DeepMind 證明了,創造力其實是一種可以被計算、被學習的高維度模式識別。這不應讓我們感到沮喪,反而應感到興奮——因為這意味著,人類將擁有一個能拓展我們認知邊界的夥伴,帶領我們看見我們肉眼凡胎看不見的風景。3. 倫理維度:奧本海默時刻註1與力量的責任 Demis 在片中多次流露出對時間的急迫感,以及對技術失控的擔憂。他將 AGI 比作電力或火,甚至提到了「奧本海默時刻」。 這部片沒有迴避 AI 的陰暗面。當技術強大到能預測蛋白質結構,它同樣可能被用於製造生化武器。DeepMind 選擇在科學期刊上公開 AlphaFold 的成果,這是一種將技術「民主化」的嘗試,但同時也將監管的難題拋給了全人類。我們在享受 AI 帶來的科學紅利時,必須同步建立起能駕馭這股力量的倫理框架,不能重蹈「快速行動,打破陳規」的矽谷舊路。
註1:「奧本海默時刻」(Oppenheimer moment)指的是科學技術帶來潛在毀滅性後果,促使科學家或社會陷入倫理和道德困境的時刻。它源自於美國物理學家J.羅伯特·奧本海默(J. Robert Oppenheimer)在參與研發原子彈後,深感其威力並倡導核武管控的經歷。如今,「奧本海默時刻」一詞常被用來比喻當前人工智慧(AI)的發展,特別是自主武器的出現,引發了全球對其倫理、安全和監管的擔憂。
三、DeepMind 邁向 AGI 的關鍵時間歷程

上圖為人物關係圖,其展示了 DeepMind 從創立、成長到取得科學突破的過程中,關鍵人物所扮演的角色。以下為您詳細解釋每一位人物在故事中的具體貢獻:
- 核心人物 (The Core)
- Demis Hassabis (德米斯·哈薩比斯)
- DeepMind 創辦人與靈魂人物。
- 他提出了「解開智慧之謎,再用它來解決一切」的宏大願景。他將不同領域的人才(遊戲設計、神經科學、機器學習)整合在一起,帶領團隊從玩 Atari 遊戲開始,一路發展到解決生物學難題(AlphaFold)。
- 早期啟蒙與奠基 (Early Influences & Foundation)
- Peter Molyneux (彼得·摩利紐)
- 傳奇遊戲設計師,牛蛙製作(Bullfrog)創辦人。
- 他是 Demis 年少時的老闆與導師。他在遊戲《主題公園》中展示了如何用程式碼模擬複雜的人類行為與經濟系統,這啟發了 Demis 後來將「虛擬環境」視為訓練 AI 最佳場所的理念。
- Tim Stevens (提姆·史蒂文斯)
- Demis 在劍橋大學的同學與好友。
- 他是科學靈感的播種者。在大學時期,他不斷向 Demis 強調「蛋白質摺疊」是生物學的聖杯,這個早期的啟發直接導致了 20 年後 DeepMind 投入資源開發 AlphaFold。
- Shane Legg (謝恩·萊格)
- DeepMind 共同創辦人。
- 他是通用人工智慧(AGI)夢想的堅定守護者。在學術界普遍不看好 AGI 的時期,他與 Demis 堅持這條路線,並負責建立 AI 安全性與理論基礎,確保 DeepMind 的發展方向不偏離「通用」智慧的目標。
- 外部催化劑 (External Catalysts)
- Peter Thiel (彼得·提爾)
- 知名創投家(PayPal 創辦人),早期投資人。
- 他在 DeepMind 只有概念、沒有產品且極具風險的階段,提供了關鍵的啟動資金(燃料)。他的投資讓團隊能夠專注於長期研究,而不需要為了短期獲利而分心。
- Lee Sedol (李世乭)
- 人類圍棋世界冠軍。
- 他是 AI 最強大的試金石。他與 AlphaGo 的對弈震驚了世界(被稱為 AI 的「史普尼克時刻」),他的落敗證明了 AI 已經能夠在直覺與創造力這類被認為是人類獨有的領域中超越人類。
- 核心科學團隊:執行願景 (Core Science Team)
- David Silver (大衛·席爾瓦)
- DeepMind 首席研究員。
- 他是 AlphaGo 與 AlphaZero 的總架構師。他帶領團隊驗證了「強化學習」的潛力,證明了 AI 可以通過自我對弈,從零開始學會超越人類的策略,完成了 DeepMind 第一階段(遊戲)的目標。
- John Jumper (約翰·強普)
- AlphaFold 團隊負責人。
- 當蛋白質摺疊項目遇到瓶頸時,他帶領「突擊隊」接手,大膽引入生物學與物理學知識重新設計 AI 模型。他的領導促成了 AlphaFold 2 的誕生,成功破解了困擾科學界 50 年的難題,完成了 DeepMind 第二階段(科學)的目標。
- 科學驗證 (Scientific Validation)
- John Moult (約翰·莫爾特)
- CASP(蛋白質結構預測技術關鍵評估)競賽主辦人。
- 他代表科學界提供了權威的第三方驗證。他發出的確認信證實了 AlphaFold 的準確率已達到「解決」問題的標準,這標誌著 DeepMind 正式從一家科技公司轉變為對人類科學有實質貢獻的機構。
四、DeepMind 邁向 AGI 的關鍵時間歷程
- 第一階段:啟蒙與驗證 (The Arcade Era)
在這個階段,DeepMind 試圖證明 AI 可以透過自我學習掌握控制權,而不僅僅是執行預設程式碼。
- 2010年 - DeepMind 成立
- 目標:Demis Hassabis、Shane Legg 與 Mustafa Suleyman 在倫敦創立公司。
- 使命:直接寫在白板上的兩行字:「Step 1: Solve Intelligence (解開智慧之謎)」、「Step 2: Use it to solve everything else (用它解決一切問題)」。
- 2013年 - Atari 遊戲測試 (DQN)
- 事件:讓 AI 玩 Atari 2600 經典遊戲(如《Space Invaders》、《Pong》、《Breakout》)。
- 突破:AI 沒有被輸入任何遊戲規則,只接收螢幕上的「像素」和「分數」。
- 關鍵時刻:在《Breakout》(打磚塊)遊戲中,AI 經過數百次訓練後,發明了**「挖地道」策略**(把球打到磚塊上方讓它自動彈跳)。這證明了 AI 具備了理解環境物理機制並制定最優策略的能力,而不僅僅是亂按。
- 2014年 - Google 收購
- 事件:Google 以約 4 億英鎊收購 DeepMind。
- 意義:DeepMind 獲得了 Google 龐大的算力資源(TPU)和資金,為接下來訓練更龐大的模型奠定基礎。
- 第二階段:直覺與創造力 (The Go Era)
這個階段的目標是挑戰被認為需要人類「直覺」和「藝術感」的領域,證明 AI 不再只是冷冰冰的計算機。
- 2016年 - AlphaGo (首爾戰役)
- 事件:AlphaGo 挑戰擁有 18 個世界冠軍頭銜的李世乭。
- 突破:圍棋變化數超過宇宙原子總數,無法靠窮舉法計算。AlphaGo 結合了深度神經網路與蒙地卡羅樹搜尋。
- 關鍵時刻:第 2 局的「第 37 手」。這一步棋被李世乭稱為「人類想不出來的一手」,標誌著 AI 展現出了創造力 (Creativity),這曾被認為是人類獨有的特質。
- 2017年 - AlphaZero (移除人類知識)
- 事件:DeepMind 發布 AlphaZero。
- 突破:與 AlphaGo 不同,AlphaZero 完全不使用人類棋譜。它從零開始,只知道規則,透過「自我對弈」學習。
- AGI 意義:這更接近 AGI,因為它證明了 AI 不需要人類導師,可以無師自通,在短短幾小時內就超越了人類數千年的圍棋智慧積累。
- 第三階段:複雜性與不完美資訊 (The Strategy Era)
現實世界不像圍棋那樣資訊完全公開,DeepMind 選擇了更複雜的即時戰略遊戲作為跳板。
- 2019年 - AlphaStar (星海爭霸 II)
- 事件:挑戰即時戰略遊戲《StarCraft II》。
- 突破:這款遊戲有「戰爭迷霧」(資訊不透明),需要長期規劃(經濟、偵查、戰鬥)。
- AGI 意義:證明了 AI 能夠在資訊不完整、需要即時反應且具備長期策略規劃的複雜環境中運作,這更接近現實世界的決策情境。
- 第四階段:回歸現實與科學突破 (The Science Era)
這是 DeepMind 的終極目標階段:將在遊戲中磨練出來的「通用演算法」,轉移到解決人類面臨的真實科學難題。
- 2018年 - CASP13 (AlphaFold 1 初試啼聲)
- 事件:首次參加蛋白質結構預測競賽(CASP)。
- 結果:雖然獲得冠軍,但準確率尚未達到實驗室等級(未解決問題)。這讓團隊意識到僅靠純粹的深度學習可能不夠,需要結合領域知識。
- 2020年 - AlphaFold 2 (解決蛋白質摺疊)
- 事件:在 CASP14 競賽中取得歷史性勝利。
- 突破:由 John Jumper 帶領團隊重新架構模型,引入幾何與物理直覺。AlphaFold 2 預測的蛋白質 3D 結構準確度達到原子級別。
- AGI 意義:這實現了當初的願景——Meta-Solution。AI 解開了困擾生物學界 50 年的難題。這證明了 AI 可以加速科學發現,是人類文明的「力量倍增器」。
- 2021年至今 - AlphaFold Database 與未來
- 事件:DeepMind 公開了人類蛋白質組及數億種預測結構的資料庫。
- 未來展望:影片結尾展示了 DeepMind 正朝向更廣泛的領域發展,包括機器人技術、聚變能源控制以及多模態模型(如 Gemini 的前身 Gato),逐步實現真正的通用人工智慧(AGI),並強調在開發過程中對倫理與安全的重視。
五、總結 DeepMind 的 AGI 路徑
這部紀錄片清晰地勾勒出 DeepMind 通往 AGI(通用人工智慧)的獨特路徑。這是一條從「虛擬模擬」走向「現實科學」,從「單一技能」走向「通用能力」的嚴謹科學探索之路。以下是 DeepMind AGI 發展路徑的總結:
玩遊戲 (Atari/DQN) ⮕ 學直覺 (AlphaGo) ⮕ 無師自通 (AlphaZero) ⮕ 處理複雜世界 (AlphaStar) ⮕ 解決科學難題 (AlphaFold) ⮕ 通用人工智慧 (AGI)













