在 AI 科技浪潮中,我們每天都被各種新模型、新應用的新聞轟炸。但真正能影響未來十年走向的觀點,往往來自於那些站在浪潮最前端的掌舵者。Google DeepMind 的 CEO,同時也是 AlphaFold 的幕後推手、諾貝爾獎得主 Demis Hassabis,無疑是其中最重要的人物之一。他在近期 All-In Summit 的一場深度專訪中,介紹了 Google AI 未來的發展藍圖,涵蓋通用人工智慧 (AGI) 的挑戰、機器人學的未來,到 AI 如何從根本上改變科學研究的宏大願景。
本文將整理部分精彩重點,訪談完整內容請看影片:
Google DeepMind CEO Demis Hassabis on AI, Creativity, and a Golden Age of Science | All-In Summit
Demis Hassabis 與 Google DeepMind:AI 研發的核心
要理解這次專訪的內容,我們首先需要知道 Demis Hassabis 是誰,以及他領導的 Google DeepMind 在做什麼。Hassabis 本人是一位橫跨多領域的奇才,從西洋棋神童、電玩遊戲設計師,到認知神經科學博士,他的人生經歷都圍繞著「智慧」這個核心主題。他與團隊因開發出能精準預測蛋白質結構的 AI 模型 AlphaFold,對生物醫學產生巨大貢獻,而共同獲得諾貝爾化學獎。
他創立的 DeepMind 在 2014 年被 Google 收購,如今已整合為 Google DeepMind,成為整個 Google 及 Alphabet 的「引擎室」(engine room),負責開發 Google 最核心的 AI 模型,如 Gemini,並將其應用於搜尋、Gmail 等幾乎所有 Google 產品線中。他們的使命不僅是開發產品,更是探索智慧的本質,推動 AI 研究的前沿。
關鍵 AI 技術:從 Genie 世界模型到 Gemini
專訪中,Hassabis 展示TN科技筆記之前文章介紹過的名為 Genie 的「世界模型」(World Model),它代表了 AI 技術發展的重要方向。
(詳細文章在這裡)
Genie 能夠僅僅透過文字描述,就即時生成一個可互動的 2D 世界。這與傳統的 3D 遊戲引擎有根本上的不同。傳統引擎需要開發者手動編寫物理規則,而 Genie 則是透過觀看數百萬部網路影片,自主學習並「逆向工程」出我們世界的運作方式,也就是所謂的「直觀物理」(intuitive physics)。
這個技術的重點,在於讓 AI 從理解抽象的語言文字,進化到理解我們身處的物理世界。這是 Google 核心模型 Gemini 從一開始就被設計為「多模態」的原因,它不僅能處理文字,也能理解圖像、聲音和影片。Hassabis 強調,讓 AI 理解物理世界,是通往更通用智慧的必經之路,也是機器人、智慧眼鏡等未來應用得以實現的基礎。
機器人學的下一步:人形是最佳解嗎?
當 AI 越來越理解物理世界,下一步自然就是與物理世界互動,這就帶到了機器人學的未來。Hassabis 認為,機器人產業的突破點即將在未來幾年內到來。
他分析,未來將是兩種形態機器人並存的局面:
- 專用型機器人: 在工廠、實驗室等特定工業場景,為了最高效率,機器人的形態會被高度客製化,以完成特定任務。
- 通用型人形機器人: 對於要融入人類日常生活的個人機器人,Hassabis 認為「人形」會是重要的設計方向。原因很實際:我們的世界,從門把高度、樓梯階梯到各種工具,都是為人類的身體形態所設計的。與其改造整個物理世界,不如讓機器人直接適應我們的環境。
Hassabis 也透露 Google 正在探索的策略之一,是打造一個類似「機器人界的 Android」的底層作業系統。這個軟體層將整合 Gemini 這類強大的多模態模型,讓機器人能理解自然語言指令並轉化為精準的物理動作,從而大幅加速整個機器人產業的硬體創新與應用普及。
通往 AGI 之路:混合模型、創造力與當前挑戰
通用人工智慧 (AGI),即具備與人類相當甚至超越的認知能力的 AI,是 Hassabis 職涯的終極目標。但他對此抱持著相對冷靜的看法,預測我們距離實現 AGI 可能還需要 5 到 10 年的時間。
他指出當前 AI 模型仍面臨幾個核心挑戰:
- 缺乏真正的創造力: 目前的 AI 擅長整合與模仿,但還無法像愛因斯坦提出相對論那樣,自主形成全新的科學假說或理論。Hassabis 提出一個思想實驗:將一個 AI 的知識庫限制在 1901 年之前,看它能否自行推導出 1905 年的相對論。這才是 AGI 創造力的試金石。
- 能力不一致: 現今的模型雖然能在某些高難度任務(如數學競賽)上表現出色,卻可能在簡單的高中數學或計數問題上犯錯。這種能力的「參差不齊」是通用智慧尚未達成的證明。
為了解決這些問題,Hassabis 提到了「混合模型」(Hybrid Models) 的概念。以 AlphaFold 為例,它並非純粹的深度學習系統,而是將神經網路的學習能力,與已知的物理和化學規則(例如原子間的鍵結角度、原子不能重疊等)相結合。這種結合學習系統與專家規則的作法,是目前解決複雜科學問題的有效途徑。他相信,通往 AGI 的道路不僅僅是擴大模型規模,很可能還需要一到兩個類似的關鍵技術突破。
AI 的能源焦慮:是問題,還是解答?
對於外界普遍擔憂 AI 發展將帶來巨大的能源消耗,Hassabis 提出了更全面的觀點。他承認,訓練最前沿的 AI 模型確實需要龐大的能源。但他也指出兩個常被忽略的面向:
- 效率持續提升: 在模型應用端(也就是我們日常使用的服務),其運算效率在過去幾年已經提升了 10 到 100 倍。透過模型蒸餾等技術,可以用一個大型的「教師模型」來訓練出更精簡、高效的「學生模型」,以極低的成本服務數十億用戶。
- AI 將回饋更多能源: 長遠來看,Hassabis 相信 AI 為能源領域帶來的效益,將遠遠超過其自身的消耗。AI 可以被用來優化電網效率、設計新型儲能材料、甚至協助控制核融合反應爐中的電漿。從這個角度看,AI 反而是解決方案的催化劑。
十年展望:AGI 將開啟科學的黃金時代
當被問及十年後的世界,Hassabis 的回答充滿了對科學發展的樂觀期待。他相信在未來十年內,我們將擁有可以被稱之為 AGI 的系統。
他認為,AGI 的到來將開啟一個全新的「科學黃金時代」,一場新的文藝復興。AI 將成為科學家最強大的工具,協助我們應對氣候變遷、疾病治療、新能源開發等人類面臨的最複雜挑戰。這也是他投身 AI 研究的初衷:不僅是解決智慧本身,更是要用智慧去解決其他所有問題。
TN科技筆記的觀點
- Hassabis 對 AGI 保持的清醒認知令人印象深刻,他強調「創造力」和「關鍵突破」而非盲目追求規模,這為當前過熱的 AGI 討論帶來理性的聲音。
- 多模態互動、理解物理世界勢必會是未來 AI 應用到機器人領域的重要方向,但要如何做出一個足夠強大的世界模型來模擬訓練,把 AI 與特定領域知識(如物理、化學)結合的「混合模型」將是有效路徑之一。
支持TN科技筆記,與科技共同前行
我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~~~也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!>>>>> 請我喝一杯咖啡
在此也感謝每個月持續請我喝杯咖啡的讀者們,讓我更加有動力為各位帶來科技新知!