Hi 我是 VK~
上周,非常難得可以訪談 Google DeepMind 研究副總裁紀懷新(Ed Chi)博士,過去他在 Xerox PARC 待了 12 年後,後來到了 Google 任職。他的職涯軌跡橫跨了認知心理學和 AI 領域。
更有趣的是,他在訪談中提到很多 AI 技術的發展,都能在認知科學中找到理論根源。比如 Chain of Thought 這篇論文的靈感,就是來自皮亞傑(Piaget)的認知發展理論。
這期會聊到:
- 前情提要:以為會聊很多 AI,結果直接大聊心理學
- Xerox PARC:從認知科學到現代 AI
- 皮亞傑的理論如何啟發 Chain of Thought?
- 開發和探索性思維:Deep Think 的進展🔒
- 系統一二思維的技術實現:AI 發展的關鍵轉折🔒
- Project Astra 的巴塞隆納測試:情境智慧的實現🔒
- 跨領域研究的關鍵:Bridge Point 思維🔒
- 結語:學習、思考和智慧🔒
喜歡這期的內容,歡迎分享給朋友一起訂閱《VK科技閱讀時間》,祝你今天一切順利~
前情提要:以為會聊很多 AI,結果直接大聊心理學
身為訪談的後發者,在訪綱準備上有些好處就是可以把近兩年來 Ed 各種英文、中文訪談/演講看了一次,然後從中找出有趣的角度、深入提問。但在眾多內容中,要再找出獨特角度,這實際上是最不容易的部分。(因為想得到的 AI 問題,大概都被問過)
為了準備這次訪談花了蠻不少時間擬訪綱,甚至在當天又幾乎重改了訪綱。原先擬定的訪綱預計先從 Ed 的職涯經歷談起(因為他以前待過 Xerox PARC)、DeepMind 近期新進展,以及 Project Astra 和智慧眼鏡等主題。
當天早上想說再看一下 Xerox PARC 這段經歷,然後這時發現一個有趣的名字:Herbert Simon。
Ed 在其他訪談中有稍微提到這位諾貝爾獎得主、心理學家曾經也待過 Xerox PARC,雖然沒有直接和他共事過,但有很多在那邊工作的人受到 Simon 的影響。
看到這名字馬上眼睛一亮,我以前在心理學教科書中讀過 Herbert Simon 的「有限理性」理論,於是整個訪談從這角度切入後,開始聊了很多認知科學、心理學,還有皮亞傑等理論,這如何在接下來 Ed 進行 AI 研究時扮演關鍵角色。
於是整集從原本預期會聊到 AI 主題,轉而問了更多是什麼樣的心理學/認知科學理論影響了 Ed 在接下來的研究,而這些研究又可以如何幫助我們在 AI 上學習和思考得更好。

Google DeepMind 資深副總裁紀懷新(Ed Chi)博士
Xerox PARC:從認知科學到現代 AI
在開始聊 Ed 的學術 AI 和心理學以前,先需要從矽谷的學術淵源介紹起。
二戰時期,史丹佛大學因為在雷達技術上的研究,在工程學院建立了強大的團隊,這個傳統一直延續到 40 年代。這個研究傳統吸引許多東岸菁英西移,HP 等公司都在史丹佛研究園區設立研究中心,後來 Xerox PARC 也是在這個脈絡下誕生的。
在這個學術網絡中,Herbert Simon 對 AI 發展產生深遠影響。Simon 最重要的貢獻是「有限理性」理論。與傳統經濟學假設的「完全理性人」不同,Simon 認為人類的決策能力是有限的,我們不會尋找最優解,而是找到足夠好的解決方案就滿足(satisficing)了。
「Simon 的認知學研究,特別是這種滿意(satisficing)概念,後來與 Daniel Kahneman 和 Amos Tversky 的前景理論形成呼應。」Ed 解釋道:「他們都在說,人並不是完全理性的思考者。」
Ed 的老闆、人機互動先驅之一 Stuart Card 是 Allen Newell 的學生,而 Newell 與 Herbert Simon 在 CMU 共同進行 AI 和 HCI 研究。因為這樣的淵源,他們推薦了最優秀的學生到 Xerox PARC 建立應用心理學部門(Applied Psychology Unit)。
這個部門的設立本身就很有意思。在一個電腦研究中心裡專門設立心理學應用部門,這在當時是革命性的想法。在 Xerox PARC,Ed 開始了跨領域研究:「我們做了很多資訊線索(Information Scent)和資訊覓食理論(Information Foraging)的研究,都是認知學與資訊科學之間的連結。」

皮亞傑的理論如何啟發 Chain of Thought?
很多人知道 Chain of Thought 是 AI 推理的重大突破,但可能不知道 Ed 正是這項技術的共同作者之一。2022 年當論文發表時,它展示的是讓 AI 「展示思考過程」。
Ed 透露,Chain of Thought 是來自認知心理學,特別是學習科學中的基模理論(schema theory)。這個想法基本上說,如果人可以用基模/框架(schema)來解決問題,那我們也可以用這種方法來教機器學習。
這段應該是完全沒有出現在過去的訪談中,Ed 在講這段時,提到基模理論的關鍵字時,腦中浮現瑞士心理學家皮亞傑(Jean Piaget)嗎?結果真的是。
Ed 提到他會知道這理論最早是因為他在唸高中和大學時,「幫助我媽媽寫她的教育心理學 PhD 論文時學到的。」這個經歷在幾十年後,成為了 AI 領域重大突破的靈感來源。
無論是在心理學或教育學中,都會提到皮亞傑的基模理論是認知發展理論的核心。在 Piaget 的理論中,基模是我們大腦中的認知框架,用來組織和理解資訊。
當我們遇到新資訊時,會試圖將它塞進現有的基模,這個過程叫做「同化」(assimilation)。但當新資訊無法塞進現有框架時,我們就需要修改或建立新的基模,這又稱「調適」(accommodation)。這個過程是學習和認知發展的核心機制。
Ed 提到,會發現皮亞傑的基模理論可以用在 Chain of Thought 上,實際上是因為對當時機器學習方法的不滿:「為什麼要用這麼多資料,機器才能學習到?我和團隊成員 Denny Zhou 開始想,可不可以用認知心理學的方法來教機器學習。」
傳統的機器學習需要大量數據來學習模式,但人類學習新概念往往只需要很少的例子。這種效率差異背後的原因是什麼?他們認為,認知心理學提供一個可能的答案:我們有現成的認知基模/框架來幫助理解新資訊。
「如果你可以用基模、框架來解決一個問題,那也許我們可以用這種方法來教機器。」這個想法的關鍵在於:與其讓機器從零開始學習每個問題,不如給它一個思考的模板。就像人類解數學題時會想「這看起來像是二次方程式問題,我應該用公式 ax² + bx + c = 0 來解」。
Chain of Thought 的核心就是教 AI 展示你的工作過程,不要直接給它答案,而是一步步說明推理過程。傳統方法會直接輸出「2 + 3 × 4 = 14」,但 Chain of Thought 會先從需要遵循運算順序。先算乘法:3 × 4 = 12,然後加法:2 + 12 = 14。這種方法讓 AI 的推理過程變得透明,也讓它能處理更複雜的多步驟問題。