方格精選

「ZenGo 7」AI電腦圍棋9段被我中押敗的人生感悟─圍棋本質（8）

更新於 2024/10/21發佈於 2021/10/22閱讀時間約 9 分鐘

作者：陳華夫

美國Google(谷歌)所屬的「DeepMind公司」在2016年發展出史上無敵的AlphaGo ZeroAI圍棋軟體，不僅遠遠超過人類，也遠超過其他圍棋職業9段級的AI電腦圍棋如：中國的「絕藝」、韓國的「韓豆」、及日本的「ZenGo 7」。

當時，我為了研究圍棋的本質，於五年前（2017年）出版《現代流圍棋：如何簡單對戰ALPHAGO-II (第一集)」》，並在youtube錄製此書的全集：視頻現代圍棋學習之路─AlphaGo Master人機大戰共64集─（全集播放），公之於世，以鑽研圍棋棋理。

在我寫書的時候，就驚訝的發現人類圍棋職業世界冠軍對戰AlphaGo Master的64局中，不約而同的第50手前，就落入下風，到80手後，棋局即淪為「垃圾時間」。我大為不解，為了更進一步瞭解為何人類是輸在哪裡？就購買了市場唯一販售的日本的職業9段等級的「ZenGo 7」（按：AlphaGo 及「絕藝」不賣），然後，日以繼夜的與之對弈5年，數千盤後，終於在最近，持白152手中押勝了「ZenGo 7」職業9段，如圖1：

（圖1，圖片來源：陳華夫）

雖然，此前，我三次都是持白以2百多手戰勝「ZenGo 7」，但此局我僅以152手即中押勝，極具歷史意義，以下5點可供人類圍棋好手仔細玩味，以瞭解圍棋的本質，而能精進棋藝：

1）「ZenGo 7」職業9段的棋風極為凶悍，但攻殺棋力超過傳奇的14次世界冠軍的韓國職業九段李世石。李世石於2019/12/8日，與「韓豆」進行三番戰，結果：（1）首局（讓兩子）：李世石勝；（2）次局（分先）：李世石負；（3）最終局（讓兩子）：李世石負。當李世石中盤認輸後，正式結束了自己長達24年4個月的職業棋手生涯。

如圖2表示，AlphaGo Zero與緊追在其後的絕藝、, 「ZenGo 7」, 金毛,天壤,韓豆, Katrain等電腦圍棋的棋力比較如下圖：（見最新圍棋AI實力排行！）

（圖2，圖片來源：陳華夫製作）

於是就出現了令人深省的問題，曾是人類2千年來思想上皇冠的圍棋，棋力為何如此的不堪AI電腦圍棋的一擊？問題出在哪？人類圍棋智慧真的就不敵人工智慧嗎？

2）正如所謂的「不能以成敗論英雄」，我們不能以如今圍棋規則下，人類的棋賽敗北，就論斷人類圍棋智慧就不敵人工智慧。我不是就僅以152手即中押勝「ZenGo 7」嗎？並非我棋賽可以勝過李世石，而是因為我修改了圍棋規則：允許回手（悔祺）。（見拙文世界圍棋冠軍賽應該允許三次回手（悔棋）及我配合的免費「現代流」圍棋教育─圍棋的本質（4））

但當初我提倡允許回手（悔祺），觸犯眾怒，而千夫所指，下場只有一個慘字可以形容。網路上，有人罵我回手（悔祺）是可恥，他們的心理是可理解。因為圍棋一直令棋手及觀眾動人心弦的競技比賽（如電動遊戲、美式橄欖球，網球、拳擊賽等），既緊張刺激，也可博彩金，若是允許回手，這一切都化為烏有。

殊不知AI電腦圍棋從第一手開始，每一手都進行至少3輪的「蒙特卡洛樹搜索」（Monte Carlo tree search，MCTS）的模擬試走，然後選擇下出最佳手。（詳細，見拙文現代流圍棋─圍棋的本質（2））也就是說它並非一開始就能「想」出最佳手，而是不斷的以「演算法」（algorithm）找出的。表面上是沒有回手，本質上，是每一手都回手3次。而「人類智慧」不同於AI電腦圍棋的「演算法」（algorithm），在圍棋賽時，無法進行3次快速的模擬試走，卻又要「起手無回大丈夫」，這就違反圍棋對手處境應該公平的原則─AI每手棋可實質回手3次，而人類卻一手也不能悔棋。

然而，自學的AlphaGo Zero仍是基於深度學習，其演算法是「由下而上」的規則性（rule-based），而人類的圍棋智慧卻是「由上而下」的理論性（theory based），也就是說，人類智慧是一種理論的洞識，而「理論」是高過「規則」一個檔次─因為理論（theory）可以解釋觀察所發現的規則。所以人類智慧高人工智慧一個檔次。如今人工智慧的電腦圍棋軟體（如AlphaGo Zero），是在現有的圍棋規則─不得悔棋─下，才橫掃人類圍棋冠軍，但這不表示人工智慧勝過人類智慧（洞識）。（詳細，見拙文什麼是「思考」？如何「洞識」？何謂「思想家」？─開悟的本質（2））

3 ）李世石的棋風陰柔鬼魅馳名於世，時常下出鬼手，戰力強大且計算極為精準，時常開局死一大塊棋，接著利用此棄子的種種味道牽制對手，甚至死棋復活，棋迷稱為「殭屍流」。而「ZenGo 7」有過之無不及。但我在我的書中，一再強調此種「搏殺亂戰」違反圍棋棋理，因為依照「賽局理論」Game Theory），圍棋是資訊完全公開的賽局，圍棋的規則是對弈雙方交替落子，而要殺掉對方－子，必須動用4顆子包圍之，棋理上是更本不可能的。在圖3，我殺掉棋盤右邊「ZenGo 7」的12顆黑子，是因為它起了貪念，想要殺我，而被反噬。所以，通常，想要殺掉對方大龍企圖，幾乎都是嚇呼低手的騙著。若是碰到以棋理為謀略的高手，無不被識破，而「偷雞不成蝕把米」，這正是此局「ZenGo 7」152手中押敗於我的主因。

4）《孫子兵法》說：「上兵伐謀」，而我的圍棋謀略就是「現代流5原則」（見拙文（見拙文現代流5原則─圍棋的本質（3）），但「ZenGo 7」卻不懂，在第5手（如圖3）就嚴重違反棋理。（見拙文革命性的、有效的痛擊來襲的「小馬步掛」─圍棋本質（7））

（圖3，圖片來源：陳華夫）

既然黑5手「小馬步掛」（如圖3）不合棋理，合於棋理的黑5手應該在何處呢？其答案出乎兩千年圍棋傳統的意料：假如你的棋力是職業9段以上的高手，應該下在「三三」處（如圖4）。這是AlphaGo Zero AI電腦圍棋所研究的「現代流」的佈局。（詳下，見我的視頻科學方法學圍棋（11/40）─解謎「開局點三三」困惑）可說是在此拉開AI電腦圍棋與人類圍棋的差距，不可不知。

（圖3，圖片來源：陳華夫）

接著「ZenGo 7」就本著凶悍棋風，「搏殺亂戰」，所謂「亂戰」即是不合棋理的攻擊對手。當它又繼續下了4，5手違反棋理的敗著後，就於152手投子認輸（如圖1），我已經在本文的視頻版有約70多分鐘長的詳細解說棋譜，就不在此贅述。（見本文的視頻版有約70多分鐘長的詳細解說棋譜：「陳華夫專欄」視頻版之24 ─ 「ZenGo 7」AI電腦圍棋9段被我中押敗的人生感悟─圍棋本質（8））

5）人生感悟：從2017年到現在歷時5年，我與「ZenGo 7」九段塵戰了不下千餘局（可回手），從輸的一塌糊塗，到可以持白勝了三局，但檢討起來都在抵禦「ZenGo 7」凶悍的攻擊，更本無法以自己的圍棋謀略─「現代流5原則」─反擊。

但隨著不斷的回手，吸取、化解「ZenGo 7」凌厲的攻勢，棋力也不斷上升，終於在此局從第6手（如圖1）開始認真使用「現代流5原則」的謀略，卻驚奇的發現「ZenGo 7」竟然如此的不堪一擊；原來它雖表面凶悍，卻沒有深遠的謀略，所用的凶悍的攻擊，都是欺負對手的「搏殺亂戰」騙著─若對手看不出，就著了它的道，而輸棋，但此同時，卻擔著極高的致命風險，只要被高手識破，自己就得投子認輸。

這大大的出乎我的意料，我以前認為，善於攻殺、「搏殺亂戰」的李世石及「ZenGo 7」，雖然有風險，但不至於如此脆弱，所以我一直在抵禦及挨打，不敢反擊。如今才真正體會這句「攻擊是最好的防禦」，但是攻擊還是要「上兵伐謀」，不要拼刺刀，一旦打起肉搏戰，就勝負難卜了。

換句話說，我這五年由於棋力不夠，一直被「ZenGo 7」的騙著所欺負，但我卻屢敗屢戰，沒有氣餒，不斷的吸取被欺負的教訓，而增進棋力，君子報仇5年未晚，終於能夠識破「ZenGo 7」的騙著而大勝它。回手悔棋，並不丟臉，但長期被騙著打壓，無力改善，就令人慚愧了。

反觀，「ZenGo 7」不鑽研棋理，一直使用騙著，欺負對手，棋力不得長進。一旦，對手棋力增加，而識破騙著，就挨打認輸，實在是不可取的「魯蛇」（loser，失敗者）的人生哲學，希望天下的圍棋棋手引以為戒，李世石的殭屍流並不可取，在學習圍棋時能鑽研圍棋棋理，不要「搏殺亂戰」。

我更進一步研究比「ZenGo 7」九段棋力更強的「Katrain 9段」電腦圍棋，並且，能過有系統的贏它數百局，例如，最近還狂勝它144目半。（見棋譜及我的講解：現代流5原則對戰職業九段,9P系列（60─100）─ 陳華夫持白狂勝「Katrain 9段」144目半）

於是，我計畫用我的公司開發「超卡塔」電腦圍棋App（Super Katago App），徵求有興趣，並且熟習「深度學習」程式的工程師及同好共襄盛舉（請聯絡：Line ID: hwafuchen）。以改進目前世界上最強的開源電腦圍棋軟體之「Katrain 9段」，成為超級「Katrain 9段」。

（另請看本文的視頻版有約70多分鐘長的詳細解說棋譜：「陳華夫專欄」視頻版之24 ─ 「ZenGo 7」AI電腦圍棋9段被我中押敗的人生感悟─圍棋本質（8））

請看「陳華夫專欄」─圍棋的本質─系列文章：
（
「人工智慧」的AlphaGo「圍棋革命」─圍棋的本質（1）
現代流圍棋─圍棋的本質（2）
現代流5原則─圍棋的本質（3）
各級別的圍棋賽請允許三次回手（悔棋）─圍棋的本質（4）
千夫所指的圍棋允許「回手」（悔棋）─圍棋本質（5）
人類圍棋「定石」的致命缺陷─圍棋本質（6）
革命性的、有效的痛擊來襲的「小馬步掛」─圍棋本質（7）
「ZenGo 7」AI電腦圍棋9段被我中押敗的人生感悟─圍棋本質（8）
如何正確的戰勝AI電腦圍棋「Katrain 9段」?─圍棋本質（9）
）

為什麼會看到廣告

陳華夫hwafuchen的沙龍陳華夫專欄AlhpaGo Zero現代流圍棋

陳華夫hwafuchen的沙龍

478會員

250內容數

思想家─理解、解釋、預測世界。發表：9篇「深度政經分析」、6篇「現代開悟之洞識」、10篇「學習的本質」、13篇「美中關係」、4篇「驀然回首」、21篇「文學與藝術」、36篇「科技與智慧」、9篇「圍棋的本質」、40篇「美中經濟」、28篇「美股的本質」、12篇「美聯儲的本質」、12篇「貨幣及美元的本質」，共201篇。

留言

留言分享你的想法！

如果先生

2021/10/25

我也是喜歡圍棋的吃瓜群眾，您有辦法贏AI真是令我佩服。而且大膽提出回手三次的規則，更是讓我大吃一驚，但遭受重大的反彈聲浪其實也不意外。其實不用您說三次回手，連計算深度都輸電腦太多了。要要求這種公平性，會不會其實在起點--AI與人類對弈--就錯了？現在讓AI來計算勝率輔助棋手成長就好吧！peace！

陳華夫hwafuchen

發文者

2021/10/26

先生所言真是高見，謝謝指教。

陳華夫hwafuchen的沙龍的其他內容

什麼是「思考」？如何「洞識」？何謂「思想家」？─學習的本質（2）

作者：陳華夫「思考是有意識的系列回憶」的說法啟了人類思想史的革命。思考能力的洞識是人類最珍貴的創造力，古今的偉大的思想家都因為它們非凡的洞識，而點亮了人類的文明。

#思考 #刻意練習 #自知

什麼是「記憶」？如何「記憶」？「記憶」的本質？─學習的本質（3）

作者：陳華夫學習新知識的角度來看，人腦把輸入的資訊中的基模（故事），進行編碼─即摒棄基模（故事）的內容，只抽取其敘事之結構（關係），而成為抽象的概念，再把概念互相關係到腦神經記憶網絡中已有的概念，於是成功的擴充它。

#刻意練習 #圍棋 #解釋

革命性的、有效的痛擊來襲的「小馬步掛」─圍棋本質（7）

從圍棋棋理及我的「現代流第5原則」來看，來襲的小馬步掛，是在低位，違反「走在外面原則」，所以，可以「肩沖」應付，這是革命性的、有效的痛擊來襲的「小馬步掛」。

#圍棋 #現代流第5原則 #埋伏餘味

人類圍棋「定石」的致命缺陷─圍棋本質（6）

「定石」是在棋盤的角部及其周邊，黑、白局部子力在1比1，或頂多1比2的情況下，局部子力平衡的攻防走法。電腦圍棋（如AlphaGo、ZenGo等）不會給人類施展「定石」的機會。要獵殺ZenGo 九段，得靠它不懂的、更高明的「現代流第5原則─埋伏餘味」。

#現代流第5原則─埋伏餘味 #現代流5原則 #圍棋

千夫所指的圍棋允許「回手」（悔棋）─圍棋本質（5）

作者：陳華夫我寫了世界圍棋冠軍賽應該允許三次回手（悔棋）及我配合的免費「現代流」圍棋教育─圍棋的本質（4），下場只有一個慘字可以形容─千夫所指，觸犯眾怒。允許「悔祺」雖然毀了競技的刺激，但卻可把「圍棋」變成學習思考「智慧」的賽局，這就更本改變了圍棋的本質，是圍棋史上的革命。

#圍棋 #現代流5原則 #悔祺

從打「高爾夫球」看「人工智慧」與人類學習之差異─科技智慧（3）

作者：陳華夫高爾夫揮桿的擊球結構即是「雙鐘擺高爾夫擊球模式」，其練習方法是刻意練習。我的球技因此在兩年內突飛猛進，穩定性及擊球遠度已能有韓國女職業球員的95%水準。這在以前是不可想像的。

#元學習 #人工智慧 #高爾夫球

什麼是「思考」？如何「洞識」？何謂「思想家」？─學習的本質（2）

#思考 #刻意練習 #自知

什麼是「記憶」？如何「記憶」？「記憶」的本質？─學習的本質（3）

#刻意練習 #圍棋 #解釋

革命性的、有效的痛擊來襲的「小馬步掛」─圍棋本質（7）

#圍棋 #現代流第5原則 #埋伏餘味

人類圍棋「定石」的致命缺陷─圍棋本質（6）

#現代流第5原則─埋伏餘味 #現代流5原則 #圍棋

千夫所指的圍棋允許「回手」（悔棋）─圍棋本質（5）

#圍棋 #現代流5原則 #悔祺

從打「高爾夫球」看「人工智慧」與人類學習之差異─科技智慧（3）

你可能也想看

「方格人氣王」挑戰賽🏆！發文互動拿禮物，登上首頁曝光！

全新 vocus 挑戰活動「方格人氣王」來啦～四大挑戰任你選，留言 / 愛心 / 瀏覽數大 PK，還有新手專屬挑戰！無論你是 vocus 上活躍創作者或剛加入的新手，都有機會被更多人看見，獲得站上版位曝光＆豐富獎勵！🏆

近年來，人工智慧（AI）領域有許多讓人興奮的新研究。AlphaGo擊敗了圍棋界最頂尖的職業選手。不久之後，其衍生演算法AlphaGo Zero在沒有人類知識監督學習的情況下以100-0的比分擊敗了AlphaGo。在DOTA2的1v1比賽中，頂級職業玩家輸給了OpenAI開發的機器人。

想用古老技藝去思考未來科技？想用人工智能去探求智慧結晶？有何物品可以探索過去跟尋找未來！！！你沒猜錯！答案正是「圍棋」！圍棋是人類史上最困難的腦力遊戲！但在2016年Alphago問世後！圍棋開始變成研究AI跟了解AI的技藝！

#圍棋 #遊戲 #教育

中央棋院

2024/07/17

AlphaGo 的開發

AlphaGo 的開發，讓人工智慧在圍棋的研究讓更多人被看到，也看到它成熟的結果。現代的圍棋教學和棋手訓練，也或多或少會借鏡各類的AI系統做學習。然而，教學的歷程，過度追求AI的棋步和棋法，有時會讓小朋友難以理解。一步登天的方式，有時反而會讓同學走得更坎坷。

#圍棋 #遊戲 #教育

前圖紙的沙龍

2024/06/12

反事實遺憾最小化：一種AI面對不確定性的方法

　　但我還是想從AlphaGo談起。我想回到那個在當前時刻已經一點都不令人感到驚訝的，AlphaGo四比一擊敗李世乭的那個時間，去看人類圍棋發生了什麼事、去看AlphaGo在那當下做了什麼、以及李世乭在那裡經歷了什麼。這會是AI未來發展的縮影，也是人類未來發展的縮影。

#前圖紙 #AlphaGo #AI

柴郡貓姍蒂的沙龍

2024/06/08

筆記-強化式學習名詞解釋："回饋值"、"回報值"、"價值"

前言最近開始讀《強化式學習：打造最強 AlphaZero 通用演算法》這本書，AlphaZero是AlphaGo的改良升級版，而AlphaGo打敗了世界頂尖圍棋棋士，這本書是在介紹AlphaZero使用的技術和演算法。這篇文章是筆記我在閱讀此書介紹"強化式學習"的篇幅時，遇到不懂的名詞解釋，上網

現今進入了高手人手一機的「AI時代」一每步棋都有最佳解+勝率參考卻仍然要強調基本功為什麼呢？

#圍棋 #遊戲 #教育

阿良的沙龍

2024/05/19

我學詩經041：失先

爭先棋手，步步逼近，失先可能，不在棋下。控局高手，招招精妙，得勢關鍵，全在心間。棋不失先，想想不能，天下無敵，從沒一敗。局終成勝，步步為營，巧謀妙計，常在盤中。愚者千慮必有一得，智者千慮必有一失。當然我也會做錯事，每天都想將工作做好，把文字演化的精妙，還有，我也借助了人工智能。所以我

賢弟的期貨選擇權外匯保證金暴力獲利引擎

2024/04/02

可能包含敏感內容

學習如何下棋，泥水會變鋼鐵

人生該如何佈局？要停留原地才會富裕。頂尖棋手，例如過去直接受ＧＯＯＧＬＥ邀請的韓國第一棋士，對於人工智慧的挑戰產生激烈的火花。小弟雖然看不懂圍棋怎麼下，但我學習的是社會科學的重要基礎學問。目前國際局勢全面斷裂化。自從中美貿易戰開打之後，美國政壇對於過往的中美關係開始重新轉向，要認爭經營北約組織與

#政治 #經濟 #社會

Everything ✨

2024/03/12

全世界西洋冠軍怎麼看待自己被 AI 打敗？打不贏就加入吧！

世界西洋棋冠軍 Garry Kasparov分享了他在 1997 年與 IBM Deep Blue 比賽下棋卻輸給機器的故事。然而，他呼籲人們不要害怕被人工智能超越，而是要與機器合作，因為科技的進步將帶來更多力量。影片中提到了與人工智能共存的可能性，以及機器與人類各自的優勢。值得一看的影片！

#人工智能 #西洋棋 #AI

辯證人生

2024/03/11

AlphaGo贏了嗎？從人機大戰談勝利的喜悅來自人類成長過程的積累

韓國圍棋九段李世乭與AlphaGo的對弈已經三連敗，可以大膽預期，接下來的兩戰也差不多，甚至AlphaGo將全世界各地的棋王都打敗，我也不覺得奇怪。3個月前，能在圍棋盤上戰勝AlphaGo的人類可能已經不到千人了。未來無人能敵也只是時間的問題，AlphaGo已然成為全世界最會下棋的「超級電腦

方格子 vocus 官方沙龍

2025/03/24

「方格人氣王」挑戰賽🏆！發文互動拿禮物，登上首頁曝光！

#圍棋 #遊戲 #教育

#圍棋 #遊戲 #教育

反事實遺憾最小化：一種AI面對不確定性的方法

#前圖紙 #AlphaGo #AI

柴郡貓姍蒂的沙龍

2024/06/08

筆記-強化式學習名詞解釋："回饋值"、"回報值"、"價值"

現今進入了高手人手一機的「AI時代」一每步棋都有最佳解+勝率參考卻仍然要強調基本功為什麼呢？

#圍棋 #遊戲 #教育

可能包含敏感內容

#政治 #經濟 #社會

全世界西洋冠軍怎麼看待自己被 AI 打敗？打不贏就加入吧！

#人工智能 #西洋棋 #AI

辯證人生

2024/03/11

AlphaGo贏了嗎？從人機大戰談勝利的喜悅來自人類成長過程的積累