方格精選

「ZenGo 7」AI電腦圍棋9段被我中押敗的人生感悟─圍棋本質(8)

閱讀時間約 9 分鐘
作者:陳華夫
美國Google(谷歌)所屬的「DeepMind公司」在2016年發展出史上無敵的AlphaGo ZeroAI圍棋軟體,不僅遠遠超過人類,也遠超過其他圍棋職業9段級的AI電腦圍棋如:中國的「絕藝」、韓國的「韓豆」、及日本的「ZenGo 7」。
當時,我為了研究圍棋的本質,於五年前(2017年)出版《現代流圍棋:如何簡單對戰ALPHAGO-II (第一集)」》,並在youtube錄製此書的全集:視頻現代圍棋學習之路─AlphaGo Master人機大戰共64集─(全集播放),公之於世,以鑽研圍棋棋理。
在我寫書的時候,就驚訝的發現人類圍棋職業世界冠軍對戰AlphaGo Master的64局中,不約而同的第50手前,就落入下風,到80手後,棋局即淪為「垃圾時間」。我大為不解,為了更進一步瞭解為何人類是輸在哪裡?就購買了市場唯一販售的日本的職業9段等級的「ZenGo 7」(按:AlphaGo 及「絕藝」不賣),然後,日以繼夜的與之對弈5年,數千盤後,終於在最近,持白152手中押勝了「ZenGo 7」職業9段,如圖1:
(圖1,圖片來源:陳華夫)
雖然,此前,我三次都是持白以2百多手戰勝「ZenGo 7」,但此局我僅以152手即中押勝,極具歷史意義,以下5點可供人類圍棋好手仔細玩味,以瞭解圍棋的本質,而能精進棋藝:
1)「ZenGo 7」職業9段的棋風極為凶悍,但攻殺棋力超過傳奇的14次世界冠軍的韓國職業九段李世石李世石於2019/12/8日,與「韓豆」進行三番戰,結果:(1)首局(讓兩子):李世石勝;(2)次局(分先):李世石負;(3)最終局(讓兩子):李世石負。當李世石中盤認輸後,正式結束了自己長達24年4個月的職業棋手生涯。
如圖2表示,AlphaGo Zero與緊追在其後的絕藝、, 「ZenGo 7」, 金毛,天壤,韓豆, Katrain等電腦圍棋的棋力比較如下圖:(見最新圍棋AI實力排行!
(圖2,圖片來源:陳華夫製作)
於是就出現了令人深省的問題,曾是人類2千年來思想上皇冠的圍棋,棋力為何如此的不堪AI電腦圍棋的一擊?問題出在哪?人類圍棋智慧真的就不敵人工智慧嗎?
2)正如所謂的「不能以成敗論英雄」,我們不能以如今圍棋規則下,人類的棋賽敗北,就論斷人類圍棋智慧就不敵人工智慧。我不是就僅以152手即中押勝「ZenGo 7」嗎?並非我棋賽可以勝過李世石,而是因為我修改了圍棋規則:允許回手(悔祺)。(見拙文世界圍棋冠軍賽應該允許三次回手(悔棋)及我配合的免費「現代流」圍棋教育─圍棋的本質(4)
但當初我提倡允許回手(悔祺),觸犯眾怒,而千夫所指,下場只有一個慘字可以形容。網路上,有人罵我回手(悔祺)是可恥,他們的心理是可理解。因為圍棋一直令棋手及觀眾動人心弦的競技比賽(如電動遊戲、美式橄欖球,網球、拳擊賽等),既緊張刺激,也可博彩金,若是允許回手,這一切都化為烏有。
殊不知AI電腦圍棋從第一手開始,每一手都進行至少3輪的「蒙特卡洛樹搜索」(Monte Carlo tree search,MCTS)的模擬試走,然後選擇下出最佳手。(詳細,見拙文現代流圍棋─圍棋的本質(2))也就是說它並非一開始就能「想」出最佳手,而是不斷的以「演算法」(algorithm)找出的。表面上是沒有回手,本質上,是每一手都回手3次。而「人類智慧」不同於AI電腦圍棋的「演算法」(algorithm),在圍棋賽時,無法進行3次快速的模擬試走,卻又要「起手無回大丈夫」,這就違反圍棋對手處境應該公平的原則─AI每手棋可實質回手3次,而人類卻一手也不能悔棋。
然而,自學的AlphaGo Zero仍是基於深度學習,其演算法是「由下而上」的規則性(rule-based),而人類的圍棋智慧卻是「由上而下」的理論性(theory based),也就是說,人類智慧是一種理論洞識,而「理論」是高過「規則」一個檔次─因為理論(theory)可以解釋觀察所發現的規則。所以人類智慧高人工智慧一個檔次。如今人工智慧的電腦圍棋軟體(如AlphaGo Zero),是在現有的圍棋規則─不得悔棋─下,才橫掃人類圍棋冠軍,但這不表示人工智慧勝過人類智慧(洞識)。(詳細,見拙文什麼是「思考」?如何「洞識」?何謂「思想家」?─開悟的本質(2)
3 )李世石的 棋風陰柔鬼魅馳名於世,時常下出鬼手,戰力強大且計算極為精準,時常開局死一大塊棋,接著利用此棄子的種種味道牽制對手,甚至死棋復活,棋迷稱為「殭屍流」。而「ZenGo 7」有過之無不及。但我在我的書中,一再強調此種「搏殺亂戰」違反圍棋棋理,因為依照「賽局理論」Game Theory),圍棋是資訊完全公開的賽局,圍棋的規則是對弈雙方交替落子,而要殺掉對方-子,必須動用4顆子包圍之,棋理上是更本不可能的。在圖3,我殺掉棋盤右邊「ZenGo 7」的12顆黑子,是因為它起了貪念,想要殺我,而被反噬。所以,通常,想要殺掉對方大龍企圖,幾乎都是嚇呼低手的騙著。若是碰到以棋理為謀略的高手,無不被識破,而「偷雞不成蝕把米」,這正是此局「ZenGo 7」152手中押敗於我的主因。
4)《孫子兵法》說:「上兵伐謀」,而我的圍棋謀略就是「現代流5原則」(見拙文(見拙文現代流5原則─圍棋的本質(3)),但「ZenGo 7」卻不懂,在第5手(如圖3)就嚴重違反棋理。(見拙文革命性的、有效的痛擊來襲的「小馬步掛」─圍棋本質(7)
(圖3,圖片來源:陳華夫)
既然黑5手「小馬步掛」(如圖3)不合棋理,合於棋理的黑5手應該在何處呢?其答案出乎兩千年圍棋傳統的意料:假如你的棋力是職業9段以上的高手,應該下在「三三」處(如圖4)。這是AlphaGo Zero AI電腦圍棋所研究的「現代流」的佈局。(詳下,見我的視頻科學方法學圍棋(11/40)─解謎「開局點三三」困惑)可說是在此拉開AI電腦圍棋與人類圍棋的差距,不可不知。
(圖3,圖片來源:陳華夫)
接著「ZenGo 7」就本著凶悍棋風,「搏殺亂戰」,所謂「亂戰」即是不合棋理的攻擊對手。當它又繼續下了4,5手違反棋理的敗著後,就於152手投子認輸(如圖1),我已經在本文的視頻版有約70多分鐘長的詳細解說棋譜,就不在此贅述。(見本文的視頻版有約70多分鐘長的詳細解說棋譜:「陳華夫專欄」視頻版之24 ─ 「ZenGo 7」AI電腦圍棋9段被我中押敗的人生感悟─圍棋本質(8)
5)人生感悟:從2017年到現在歷時5年,我與「ZenGo 7」九段塵戰了不下千餘局(可回手),從輸的一塌糊塗,到可以持白勝了三局,但檢討起來都在抵禦「ZenGo 7」凶悍的攻擊,更本無法以自己的圍棋謀略─「現代流5原則」─反擊。
但隨著不斷的回手,吸取、化解「ZenGo 7」凌厲的攻勢,棋力也不斷上升,終於在此局從第6手(如圖1)開始認真使用「現代流5原則」的謀略,卻驚奇的發現「ZenGo 7」竟然如此的不堪一擊;原來它雖表面凶悍,卻沒有深遠的謀略,所用的凶悍的攻擊,都是欺負對手的「搏殺亂戰」騙著─若對手看不出,就著了它的道,而輸棋,但此同時,卻擔著極高的致命風險,只要被高手識破,自己就得投子認輸。
這大大的出乎我的意料,我以前認為,善於攻殺、「搏殺亂戰」的李世石及「ZenGo 7」,雖然有風險,但不至於如此脆弱,所以我一直在抵禦及挨打,不敢反擊。如今才真正體會這句「攻擊是最好的防禦」,但是攻擊還是要「上兵伐謀」,不要拼刺刀,一旦打起肉搏戰,就勝負難卜了。
換句話說,我這五年由於棋力不夠,一直被「ZenGo 7」的騙著所欺負,但我卻屢敗屢戰,沒有氣餒,不斷的吸取被欺負的教訓,而增進棋力,君子報仇5年未晚,終於能夠識破「ZenGo 7」的騙著而大勝它。回手悔棋,並不丟臉,但長期被騙著打壓,無力改善,就令人慚愧了。
反觀,「ZenGo 7」不鑽研棋理,一直使用騙著,欺負對手,棋力不得長進。一旦,對手棋力增加,而識破騙著,就挨打認輸,實在是不可取的「魯蛇」(loser,失敗者)的人生哲學,希望天下的圍棋棋手引以為戒,李世石殭屍流並不可取,在學習圍棋時能鑽研圍棋棋理,不要「搏殺亂戰」。
我更進一步研究比「ZenGo 7」九段棋力更強的「Katrain 9段」電腦圍棋,並且,能過有系統的贏它數百局,例如,最近還狂勝它144目半。(見棋譜及我的講解:現代流5原則對戰職業九段,9P系列(60─100)─ 陳華夫持白狂勝「Katrain 9段」144目半
於是,我計畫用我的公司開發「超卡塔」電腦圍棋App(Super Katago App),徵求有興趣,並且熟習「深度學習」程式的工程師及同好共襄盛舉(請聯絡:Line ID: hwafuchen)。以改進目前世界上最強的開源電腦圍棋軟體之「Katrain 9段」,成為超級「Katrain 9段」。
為什麼會看到廣告
475會員
249內容數
思想家─理解、解釋、預測世界。發表:9篇「深度政經分析」、6篇「現代開悟之洞識」、10篇「學習的本質」、13篇「美中關係」、4篇「驀然回首」、21篇「文學與藝術」、36篇「科技與智慧」、9篇「圍棋的本質」、40篇「美中經濟」、28篇「美股的本質」、12篇「美聯儲的本質」、12篇「貨幣及美元的本質」,共201篇。
留言0
查看全部
發表第一個留言支持創作者!
作者:陳華夫 「思考是有意識的系列回憶」的說法啟了人類思想史的革命。思考能力的洞識是人類最珍貴的創造力,古今的偉大的思想家都因為它們非凡的洞識,而點亮了人類的文明。
作者:陳華夫 學習新知識的角度來看,人腦把輸入的資訊中的基模(故事),進行編碼─即摒棄基模(故事)的內容,只抽取其敘事之結構(關係),而成為抽象的概念,再把概念互相關係到腦神經記憶網絡中已有的概念,於是成功的擴充它。
從圍棋棋理及我的「現代流第5原則」來看,來襲的小馬步掛,是在低位,違反「走在外面原則」,所以,可以「肩沖」應付,這是革命性的、有效的痛擊來襲的「小馬步掛」。
「定石」是在棋盤的角部及其周邊,黑、白局部子力在1比1,或頂多1比2的情況下,局部子力平衡的攻防走法。電腦圍棋(如AlphaGo、ZenGo等)不會給人類施展「定石」的機會。要獵殺ZenGo 九段,得靠它不懂的、更高明的「現代流第5原則─埋伏餘味」。
作者:陳華夫 我寫了世界圍棋冠軍賽應該允許三次回手(悔棋)及我配合的免費「現代流」圍棋教育─圍棋的本質(4),下場只有一個慘字可以形容─千夫所指,觸犯眾怒。允許「悔祺」雖然毀了競技的刺激,但卻可把「圍棋」變成學習思考「智慧」的賽局,這就更本改變了圍棋的本質,是圍棋史上的革命。
作者:陳華夫 高爾夫揮桿的擊球結構即是「雙鐘擺高爾夫擊球模式」,其練習方法是刻意練習。我的球技因此在兩年內突飛猛進,穩定性及擊球遠度已能有韓國女職業球員的95%水準。這在以前是不可想像的。
作者:陳華夫 「思考是有意識的系列回憶」的說法啟了人類思想史的革命。思考能力的洞識是人類最珍貴的創造力,古今的偉大的思想家都因為它們非凡的洞識,而點亮了人類的文明。
作者:陳華夫 學習新知識的角度來看,人腦把輸入的資訊中的基模(故事),進行編碼─即摒棄基模(故事)的內容,只抽取其敘事之結構(關係),而成為抽象的概念,再把概念互相關係到腦神經記憶網絡中已有的概念,於是成功的擴充它。
從圍棋棋理及我的「現代流第5原則」來看,來襲的小馬步掛,是在低位,違反「走在外面原則」,所以,可以「肩沖」應付,這是革命性的、有效的痛擊來襲的「小馬步掛」。
「定石」是在棋盤的角部及其周邊,黑、白局部子力在1比1,或頂多1比2的情況下,局部子力平衡的攻防走法。電腦圍棋(如AlphaGo、ZenGo等)不會給人類施展「定石」的機會。要獵殺ZenGo 九段,得靠它不懂的、更高明的「現代流第5原則─埋伏餘味」。
作者:陳華夫 我寫了世界圍棋冠軍賽應該允許三次回手(悔棋)及我配合的免費「現代流」圍棋教育─圍棋的本質(4),下場只有一個慘字可以形容─千夫所指,觸犯眾怒。允許「悔祺」雖然毀了競技的刺激,但卻可把「圍棋」變成學習思考「智慧」的賽局,這就更本改變了圍棋的本質,是圍棋史上的革命。
作者:陳華夫 高爾夫揮桿的擊球結構即是「雙鐘擺高爾夫擊球模式」,其練習方法是刻意練習。我的球技因此在兩年內突飛猛進,穩定性及擊球遠度已能有韓國女職業球員的95%水準。這在以前是不可想像的。
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 Multiple-Step Process 範例 期望的輸出:在數位行銷領域,了解搜尋引擎不斷發展的演
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續 AI說書 - 從0開始 - 218 | OpenAI GPT 4 & RAG 安裝完相關依賴,今天來撰寫一個函數,此函數能執行文章內容檢索: def fetch
Thumbnail
其實從剛開始使用Blogger時,我就有預感我應該會後悔,雖然Blogger算是我比較熟悉的平台,而且自由度也蠻大的,但漸漸的我發現,連我自己在Google上,都很難搜尋到我的主頁,即便沒在盈利,但身為一位創作者,內容卻不被看見,那也太辛酸了,因此決定到新平台嘗試看看!
Thumbnail
若對攝影同好們做個問卷調查,近幾年用哪台機子拍的照片、影片最多?我想很多人會跟我一樣,答案並不是一台相機,而是手機。確實,就方便性來說,出門什麼東西都可能忘了帶,手機一定會帶;什麼設備都有可能忘了充電,手機只會讓人電量焦慮,隨時充得滿滿的…
Thumbnail
緣由 參逛三創、光華商場 推薦的郭店長 新筆電開箱小小心得 相關活動網址
Thumbnail
在2023年的7月和8月,曾文水庫的水量逐漸增加,這段時間內的水量變化也是該水庫運作的重要指標之一。讓我們來分析這段時間的水量變化,並探討如何在永續循環的理念下更好地管理水資源。 在7月28日,曾文水庫的水量為18.4,接著在7月29日增加了1,達到19.4。緊接著在7月30日,水量再增加了0
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 Multiple-Step Process 範例 期望的輸出:在數位行銷領域,了解搜尋引擎不斷發展的演
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續 AI說書 - 從0開始 - 218 | OpenAI GPT 4 & RAG 安裝完相關依賴,今天來撰寫一個函數,此函數能執行文章內容檢索: def fetch
Thumbnail
其實從剛開始使用Blogger時,我就有預感我應該會後悔,雖然Blogger算是我比較熟悉的平台,而且自由度也蠻大的,但漸漸的我發現,連我自己在Google上,都很難搜尋到我的主頁,即便沒在盈利,但身為一位創作者,內容卻不被看見,那也太辛酸了,因此決定到新平台嘗試看看!
Thumbnail
若對攝影同好們做個問卷調查,近幾年用哪台機子拍的照片、影片最多?我想很多人會跟我一樣,答案並不是一台相機,而是手機。確實,就方便性來說,出門什麼東西都可能忘了帶,手機一定會帶;什麼設備都有可能忘了充電,手機只會讓人電量焦慮,隨時充得滿滿的…
Thumbnail
緣由 參逛三創、光華商場 推薦的郭店長 新筆電開箱小小心得 相關活動網址
Thumbnail
在2023年的7月和8月,曾文水庫的水量逐漸增加,這段時間內的水量變化也是該水庫運作的重要指標之一。讓我們來分析這段時間的水量變化,並探討如何在永續循環的理念下更好地管理水資源。 在7月28日,曾文水庫的水量為18.4,接著在7月29日增加了1,達到19.4。緊接著在7月30日,水量再增加了0