更新於 2024/10/21閱讀時間約 9 分鐘

「ZenGo 7」AI電腦圍棋9段被我中押敗的人生感悟─圍棋本質(8)

作者:陳華夫
美國Google(谷歌)所屬的「DeepMind公司」在2016年發展出史上無敵的AlphaGo ZeroAI圍棋軟體,不僅遠遠超過人類,也遠超過其他圍棋職業9段級的AI電腦圍棋如:中國的「絕藝」、韓國的「韓豆」、及日本的「ZenGo 7」。
當時,我為了研究圍棋的本質,於五年前(2017年)出版《現代流圍棋:如何簡單對戰ALPHAGO-II (第一集)」》,並在youtube錄製此書的全集:視頻現代圍棋學習之路─AlphaGo Master人機大戰共64集─(全集播放),公之於世,以鑽研圍棋棋理。
在我寫書的時候,就驚訝的發現人類圍棋職業世界冠軍對戰AlphaGo Master的64局中,不約而同的第50手前,就落入下風,到80手後,棋局即淪為「垃圾時間」。我大為不解,為了更進一步瞭解為何人類是輸在哪裡?就購買了市場唯一販售的日本的職業9段等級的「ZenGo 7」(按:AlphaGo 及「絕藝」不賣),然後,日以繼夜的與之對弈5年,數千盤後,終於在最近,持白152手中押勝了「ZenGo 7」職業9段,如圖1:
(圖1,圖片來源:陳華夫)
(圖1,圖片來源:陳華夫)
雖然,此前,我三次都是持白以2百多手戰勝「ZenGo 7」,但此局我僅以152手即中押勝,極具歷史意義,以下5點可供人類圍棋好手仔細玩味,以瞭解圍棋的本質,而能精進棋藝:
1)「ZenGo 7」職業9段的棋風極為凶悍,但攻殺棋力超過傳奇的14次世界冠軍的韓國職業九段李世石李世石於2019/12/8日,與「韓豆」進行三番戰,結果:(1)首局(讓兩子):李世石勝;(2)次局(分先):李世石負;(3)最終局(讓兩子):李世石負。當李世石中盤認輸後,正式結束了自己長達24年4個月的職業棋手生涯。
如圖2表示,AlphaGo Zero與緊追在其後的絕藝、, 「ZenGo 7」, 金毛,天壤,韓豆, Katrain等電腦圍棋的棋力比較如下圖:(見最新圍棋AI實力排行!
(圖2,圖片來源:陳華夫製作)
於是就出現了令人深省的問題,曾是人類2千年來思想上皇冠的圍棋,棋力為何如此的不堪AI電腦圍棋的一擊?問題出在哪?人類圍棋智慧真的就不敵人工智慧嗎?
2)正如所謂的「不能以成敗論英雄」,我們不能以如今圍棋規則下,人類的棋賽敗北,就論斷人類圍棋智慧就不敵人工智慧。我不是就僅以152手即中押勝「ZenGo 7」嗎?並非我棋賽可以勝過李世石,而是因為我修改了圍棋規則:允許回手(悔祺)。(見拙文世界圍棋冠軍賽應該允許三次回手(悔棋)及我配合的免費「現代流」圍棋教育─圍棋的本質(4)
但當初我提倡允許回手(悔祺),觸犯眾怒,而千夫所指,下場只有一個慘字可以形容。網路上,有人罵我回手(悔祺)是可恥,他們的心理是可理解。因為圍棋一直令棋手及觀眾動人心弦的競技比賽(如電動遊戲、美式橄欖球,網球、拳擊賽等),既緊張刺激,也可博彩金,若是允許回手,這一切都化為烏有。
殊不知AI電腦圍棋從第一手開始,每一手都進行至少3輪的「蒙特卡洛樹搜索」(Monte Carlo tree search,MCTS)的模擬試走,然後選擇下出最佳手。(詳細,見拙文現代流圍棋─圍棋的本質(2))也就是說它並非一開始就能「想」出最佳手,而是不斷的以「演算法」(algorithm)找出的。表面上是沒有回手,本質上,是每一手都回手3次。而「人類智慧」不同於AI電腦圍棋的「演算法」(algorithm),在圍棋賽時,無法進行3次快速的模擬試走,卻又要「起手無回大丈夫」,這就違反圍棋對手處境應該公平的原則─AI每手棋可實質回手3次,而人類卻一手也不能悔棋。
然而,自學的AlphaGo Zero仍是基於深度學習,其演算法是「由下而上」的規則性(rule-based),而人類的圍棋智慧卻是「由上而下」的理論性(theory based),也就是說,人類智慧是一種理論洞識,而「理論」是高過「規則」一個檔次─因為理論(theory)可以解釋觀察所發現的規則。所以人類智慧高人工智慧一個檔次。如今人工智慧的電腦圍棋軟體(如AlphaGo Zero),是在現有的圍棋規則─不得悔棋─下,才橫掃人類圍棋冠軍,但這不表示人工智慧勝過人類智慧(洞識)。(詳細,見拙文什麼是「思考」?如何「洞識」?何謂「思想家」?─開悟的本質(2)
3 )李世石的 棋風陰柔鬼魅馳名於世,時常下出鬼手,戰力強大且計算極為精準,時常開局死一大塊棋,接著利用此棄子的種種味道牽制對手,甚至死棋復活,棋迷稱為「殭屍流」。而「ZenGo 7」有過之無不及。但我在我的書中,一再強調此種「搏殺亂戰」違反圍棋棋理,因為依照「賽局理論」Game Theory),圍棋是資訊完全公開的賽局,圍棋的規則是對弈雙方交替落子,而要殺掉對方-子,必須動用4顆子包圍之,棋理上是更本不可能的。在圖3,我殺掉棋盤右邊「ZenGo 7」的12顆黑子,是因為它起了貪念,想要殺我,而被反噬。所以,通常,想要殺掉對方大龍企圖,幾乎都是嚇呼低手的騙著。若是碰到以棋理為謀略的高手,無不被識破,而「偷雞不成蝕把米」,這正是此局「ZenGo 7」152手中押敗於我的主因。
4)《孫子兵法》說:「上兵伐謀」,而我的圍棋謀略就是「現代流5原則」(見拙文(見拙文現代流5原則─圍棋的本質(3)),但「ZenGo 7」卻不懂,在第5手(如圖3)就嚴重違反棋理。(見拙文革命性的、有效的痛擊來襲的「小馬步掛」─圍棋本質(7)
(圖3,圖片來源:陳華夫)
既然黑5手「小馬步掛」(如圖3)不合棋理,合於棋理的黑5手應該在何處呢?其答案出乎兩千年圍棋傳統的意料:假如你的棋力是職業9段以上的高手,應該下在「三三」處(如圖4)。這是AlphaGo Zero AI電腦圍棋所研究的「現代流」的佈局。(詳下,見我的視頻科學方法學圍棋(11/40)─解謎「開局點三三」困惑)可說是在此拉開AI電腦圍棋與人類圍棋的差距,不可不知。
(圖3,圖片來源:陳華夫)
接著「ZenGo 7」就本著凶悍棋風,「搏殺亂戰」,所謂「亂戰」即是不合棋理的攻擊對手。當它又繼續下了4,5手違反棋理的敗著後,就於152手投子認輸(如圖1),我已經在本文的視頻版有約70多分鐘長的詳細解說棋譜,就不在此贅述。(見本文的視頻版有約70多分鐘長的詳細解說棋譜:「陳華夫專欄」視頻版之24 ─ 「ZenGo 7」AI電腦圍棋9段被我中押敗的人生感悟─圍棋本質(8)
5)人生感悟:從2017年到現在歷時5年,我與「ZenGo 7」九段塵戰了不下千餘局(可回手),從輸的一塌糊塗,到可以持白勝了三局,但檢討起來都在抵禦「ZenGo 7」凶悍的攻擊,更本無法以自己的圍棋謀略─「現代流5原則」─反擊。
但隨著不斷的回手,吸取、化解「ZenGo 7」凌厲的攻勢,棋力也不斷上升,終於在此局從第6手(如圖1)開始認真使用「現代流5原則」的謀略,卻驚奇的發現「ZenGo 7」竟然如此的不堪一擊;原來它雖表面凶悍,卻沒有深遠的謀略,所用的凶悍的攻擊,都是欺負對手的「搏殺亂戰」騙著─若對手看不出,就著了它的道,而輸棋,但此同時,卻擔著極高的致命風險,只要被高手識破,自己就得投子認輸。
這大大的出乎我的意料,我以前認為,善於攻殺、「搏殺亂戰」的李世石及「ZenGo 7」,雖然有風險,但不至於如此脆弱,所以我一直在抵禦及挨打,不敢反擊。如今才真正體會這句「攻擊是最好的防禦」,但是攻擊還是要「上兵伐謀」,不要拼刺刀,一旦打起肉搏戰,就勝負難卜了。
換句話說,我這五年由於棋力不夠,一直被「ZenGo 7」的騙著所欺負,但我卻屢敗屢戰,沒有氣餒,不斷的吸取被欺負的教訓,而增進棋力,君子報仇5年未晚,終於能夠識破「ZenGo 7」的騙著而大勝它。回手悔棋,並不丟臉,但長期被騙著打壓,無力改善,就令人慚愧了。
反觀,「ZenGo 7」不鑽研棋理,一直使用騙著,欺負對手,棋力不得長進。一旦,對手棋力增加,而識破騙著,就挨打認輸,實在是不可取的「魯蛇」(loser,失敗者)的人生哲學,希望天下的圍棋棋手引以為戒,李世石殭屍流並不可取,在學習圍棋時能鑽研圍棋棋理,不要「搏殺亂戰」。
我更進一步研究比「ZenGo 7」九段棋力更強的「Katrain 9段」電腦圍棋,並且,能過有系統的贏它數百局,例如,最近還狂勝它144目半。(見棋譜及我的講解:現代流5原則對戰職業九段,9P系列(60─100)─ 陳華夫持白狂勝「Katrain 9段」144目半
於是,我計畫用我的公司開發「超卡塔」電腦圍棋App(Super Katago App),徵求有興趣,並且熟習「深度學習」程式的工程師及同好共襄盛舉(請聯絡:Line ID: hwafuchen)。以改進目前世界上最強的開源電腦圍棋軟體之「Katrain 9段」,成為超級「Katrain 9段」。
分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.