作者:陳華夫
利用人工智慧,美國「谷歌」所屬的DeepMind公司從2016年發展出史上無敵的AlphaGo Zero圍棋軟體,不僅遠遠超過人類,緊追在後的國的絕藝、日本的「ZenGo7」、開源的Katrain等電腦圍棋的棋力也遠超過人類。。回顧歷史,2016/3月,DeepMind公司開發的AlphaGo Lee以4:1戰勝世界冠軍韓國職業棋士李世石九段。2016/12/29日升級版的AlphaGo Master在弈城圍棋網及騰訊野狐圍棋網,以60:0戰勝中、韓、日、台的圍棋世界冠軍。(按:我在2017年仔細分析了這60局,而寫了《現代流圍棋:如何簡單對戰ALPHAGO-II (第一集)》,並將此書製作60集youtube視頻:現代圍棋學習之路─AlphaGo Master人機大戰共64集─(全集播放))在2017/10/19日DeepMind公司在《自然》雜誌上發表了劃時代的論文:「Mastering the game of go without human knowledge,David Silver, .et.al, Nature, 550, 354-359, 2017」(中文翻譯:不需要人類圍棋經驗練的超級電腦圍棋軟體),而推出了迄今圍棋史上棋力最強的版本:AlphaGo Zero,它擺脫了它的前身─AlphaGo Lee及AlphaGo Master ─必須借助使用人類KGS圍棋伺服器棋譜進行監督學習,完全由零(Zero)開始,不需要人為指導,只是自己和自己不斷對弈,來訓練自己。AlphaGo Zero經過3天的學習就以100:0的比數擊敗AlphaGo Lee的實力,而在21天後達到了AlphaGo Master的水平,並在40天內超過了所有之前的版本,成為史上無敵的圍棋軟體。

(圖片來源:Mastering the game of go without human knowledge,David Silver, .et.al, Nature, 550, 354-359, 2017)
而AlphaGo Zero與緊追在其後的絕藝、, 「ZenGo 7」, 金毛,天壤,韓豆, Katrain等電腦圍棋的棋力比較如下圖:(見最新圍棋AI實力排行!)

(圖片來源:陳華夫製作)
雖然AlphaGo Zero的棋力史上無敵,但它畢竟是基於人工智慧所開發出來的圍棋軟體,與人類智慧比較,人工智慧有不少缺陷。(見拙文AI「深度學習」的缺陷及我親身的補正?─科技智慧(5))簡要的說,人工智慧所開發出來的圍棋軟體雖然能贏棋,卻無法模塊化圍棋知識及提煉圍棋對弈致勝的規則(規律),以教導人類如何學習圍棋。
而人工智慧的學習另一個致命傷是無法舉一反三的學習轉移(Transfer of learning)─即把學習到的知識及技能舉一反三的應用到新的情況或不同的領域。例如,DeepMind公司再發展AlphaGo Lee,AlphaGo Master,及AlphaGo Zero等3個版本時,各個版本都是獨立構造,和獨立進行訓練的,也就是說,各版本的圍棋知識無法舉一反三的學習轉移到其它的版本上。相反的,人類的智慧可以分解組合知識是的,及舉一反三的學習轉移到新領域。
然而,自學的AlphaGo Zero仍是基於深度學習,其演算法是「由下而上」的規則性(rule-based),而人類的圍棋智慧卻是「由上而下」的理論性(theory based),也就是說,人類智慧是一種理論的洞識,而理論及推理是高過規則一個檔次(見人類才不會被AI取代!《大腦如何精準學習》揭大腦6大優點:目前的人工智慧永遠學不來)。所以人類智慧高人工智慧一個檔次。而我就成功的抽取出圍棋的理論:現代流圍棋五原則,並以它奮戰「ZenGo 九段」與「Katrain 9段」。在經過4、5年,我現在已能有系統的持白大勝「ZenGo 九段」與「Katrain 9段」,證明了人類智慧還是有機會戰勝人工智慧的電腦圍棋軟體。(請看拙文如何正確的戰勝AI電腦圍棋「Katrain 9段」?─圍棋本質(9)、及youtube視頻現代流5原則對戰職業九段,9P系列(60─100)─ 陳華夫持白狂勝「Katrain 9段」144目半)
請看「陳華夫專欄」─圍棋的本質─系列文章:
(
「人工智慧」的AlphaGo「圍棋革命」─圍棋的本質(1)
現代流圍棋─圍棋的本質(2)
現代流5原則─圍棋的本質(3)
各級別的圍棋賽請允許三次回手(悔棋)─圍棋的本質(4)
千夫所指的圍棋允許「回手」(悔棋)─圍棋本質(5)
人類圍棋「定石」的致命缺陷─圍棋本質(6)
革命性的、有效的痛擊來襲的「小馬步掛」─圍棋本質(7)
「ZenGo 7」AI電腦圍棋9段被我中押敗的人生感悟─圍棋本質(8)
如何正確的戰勝AI電腦圍棋「Katrain 9段」?─圍棋本質(9)
)
AlphaGo Zero自學成才,輕易擊敗上一代AlphaGo
學會學習Learning to Learn:讓AI擁有核心價值觀從而實現快速學習
最前沿:百家爭鳴的Meta Learning/Learning to learn
Brute computing force alone can't solve the world's problems.