現代流5原則─圍棋的本質(3)

2
2020-08-16
|閱讀時間 ‧ 約 13 分鐘
作者:陳華夫
發表了現代流圍棋─圍棋的本質(1)後有讀者對「現代流5原則」很是好奇。
(圖片來源:陳華夫)
追問「現代流5原則」的由來?為何是5原則?而不是4原則或6原則?
這個問題的確牽涉到圍棋的本質,在我寫「現代流圍棋:如何簡單對戰ALPHAGO-II (第一集)」一書時,只有「現代流4原則」,是我當時研究AlphpaGo Master橫掃人類圍棋世界冠軍總共64局,所歸納出來的「現代流圍棋」的致勝策略。但,一年後,「谷歌Google」在「Nature」上發表了更先進的AlphpaGo Zero,棋力可以讓AlphpaGo Master兩子。令我異常驚訝,天下竟然還有如此高的棋力,於是決心要搞清楚AlphpaGo Zero的厲害高明之處?
當我用功研究谷歌在「Nature」上所發表的AlphpaGo Zero對戰AlphpaGo Lee、AlphpaGo Zero對戰AlphpaGo Master、及AlphpaGo Zero自我對戰的棋譜後,才發現AlphpaGo Zero的棋力高超之處,除了也運用我書中所提倡的「現代流4原則」,還多用了一精妙的原則─「埋伏餘味原則」。所以我立刻把4原則擴充,就有了天下無敵的「現代流5原則」。(請看拙文人類圍棋「定石」的致命缺陷─圍棋本質(6)「ZenGo 7」AI電腦圍棋9段被我中押敗的人生感悟─圍棋本質(8)
如下圖表示,「ZenGo 7」可以勝人類,而「絕藝」、「韓豆」、「Katrain」等級的電腦圍棋可以讓人類2子,而根據Google(谷歌)的推算AlphaGo Zero可以讓人類5子。(見拙文:「人工智慧」的AlphaGo「圍棋革命」─圍棋的本質(1),及最新圍棋AI實力排行!
(圖片來源:陳華夫)
於是「現代流5原則」在實戰中,即是落子的方針;在「覆盤」檢討時,則是評價好棋、壞棋的價值系統。例如,「不留弱棋原則」和「非戰原則」往往不能同時成立,而「走在外面原則」與「圍地致勝原則」本來就是相抵觸的。圍棋的本質就在如何選用、取捨相互矛盾的5原則。對戰雙方,誰能使用出5原則的總數越多,誰的棋力就越高,也會是勝方。換句話說,圍棋是高層次原則(大局觀)的鬥智,而非低層次目數多少的較勁,而一般傳統圍棋沒有「現代流5原則」的「覆盤」評價系統,棋力自然成長有限,難怪被AlphpaGo讓5子還沒法勝。
人類要有效的提高棋力,擺脫被讓5子的窘境,就要能夠 「元學習」(Meta Learning)─即有意識(非直覺)的控制自己的學習─圍棋,而「元學習」圍棋的關鍵就在,弈棋之初,就先要有一套弈棋原則,作為落子的方針及「覆盤」檢討的價值系統,而「現代流5原則」正是此套弈棋原則。但光有弈棋原則並不能提高棋力為高手。而棋力提高之道就在「有意識」(自覺)的在棋局中選用、取捨這些原則。而非「元學習」的圍棋學習,因為缺少一套弈棋原則來做高層次「大局觀」的「覆盤」檢討,棋力成長受限。
「元學習」(Meta Learning)的實踐方法即是經過精心組織的「刻意練習」,要訣是3F:(1)Focus─專注學習目標,(2)Feedback─回饋達標差距,(3)Fix─不斷改善達標差距。在「刻意練習」中,主掌腦部記憶的海馬體可以生長,神經元也變的連接更多。大腦變得更聰明,更高效。「元學習」的關鍵是在學習之初,要「有意識」的掌握該學習的基本原則,而在學習圍棋時的基本原則就是「現代流5原則」,它們扮演兩個角色:一是在作為整個學習的指導方針,而作為「刻意練習」的學習目標。發現學習的瓶頸及克服之道,另一是做為學習結果的評量圭臬(準則)。(詳細請看拙文諾貝爾獎的教育反思─「自學」─驀然回首(18)
要想「有意識」(自覺)的使用「現代流5原則」,就要充分瞭解其意義及應用,下面就基於圍棋的本質,簡單扼要的詮釋5原則的意義,並且每一個原則都舉實際我用以戰勝AI電腦圍棋Katrain 九段的棋譜為講解例子:
1)「非戰原則」:這是「現代流5原則」的第一原則,也是最被誤解的原則。人類幾千年的圍棋策略是「搏殺對方大龍致勝」之「追殺致勝原則」。但要在棋盤上要殺死對方一塊棋,完全違反圍棋的本質與棋理,因為「賽局理論」Game Theory),圍棋是資訊完全公開、雙方各自走一手的公平賽局。理論上,若遭對方來追殺,己方可以棄子,而騰出手圍另一塊地。那麼,對方殺你一個子要花4手,只得一目,而你卻能以4手圍二、三十目。 並且,實戰中,依照棋理,局部的對戰,若對方是5棋子,而己方是3棋子,則對方是5:3的「優勢」,己方不能念戰搏殺,宜用棄子戰術。而優勢的一方更是切忌「追殺」弱子,因為「窮寇莫追」,恐遭「狗急跳牆」的反噬。所以「非戰原則」是要說明圍棋攻殺的目的並非是搏殺大龍,而是為了棄子或交換,這才是最高級的圍棋策略之一,AI電腦圍棋就善用此招打敗人類。請看我與「Katrain 9段」對戰的實際例子:現代流5原則對戰職業九段,9P系列(11─100)─ 陳華夫持白以棄子戰術25目半勝「Katrain 9段」。 此外,Katrain 九段在圍棋局部的攻殺,計算深遠,超乎人類。但它的AI人工智慧卻有系統性的缺陷,而屢屢敗於我的高級圍棋策略:如「棄子戰術」、「埋伏餘味」、及「劫爭」等。這是因為Katrain 九段演算法(algorithm)只能有效的處理局部的利益得失,而對犧牲局部利益,在他處卻獲利的計算,例如,Katrain 九段碰到蓄意先在正面衝突中失利,而引誘敵它深入陷阱後,再殲滅它的迂迴戰略,就計算失靈,束手無策了。例如,「Katrain 9段」在「現代流5原則對戰職業九段,9P系列(18─100)─陳華夫持白「Katrain 9段」錯打3個劫爭狂輸25目半」裡,在它還沒有開啟打劫時,盤面是細棋,打收官戰。但它卻計謀打劫,從黑87手起,一連打了3個錯誤的劫,而狂輸25目半。
2)「圍地致勝原則」:這是現代流5原則的第2原則。依照圍棋規則,勝負的判定,是依雙方各自在19 x 19棋盤上,所圈定的地盤多少而定,多半點以上一方就算獲勝。而此「圍地致勝原則」的原則包括兩個決策:(1)「增加自己的目數」:要增加目數必需建築立體的「有目屋」─ 圍有目數的棋子群組。 圍棋有一個口訣:「金角,銀邊,草肚皮」,這是圍棋的基本棋理,它是說4個角上的「有目屋」只要砌兩面牆,而4個邊上的要砌三面牆,中腹的要砌四面牆。這樣為圍角地所需花的手數較少,每一顆子的圍地效率最高,例如,小目的子加上小馬步非可圍16目左右,所以圍角地的效率約是:8目/子,而圍邊地的效率為約4目/子,而圍邊地的效率約為2目/子。這聽起來簡易的棋理,卻常被忽視。例如,「Katrain 9段」在「現代流5原則對戰職業九段,9P系列(19─100)─ 陳華夫持白「Katrain 9段」不懂「金角銀邊草肚皮」棋理而輸了3目半」這一局裡,就不懂「金角銀邊草肚皮」的棋理,而輸了3目半,可以給大家一個警惕。 另外,更重要的,不要單純的砌牆圍地,要借攻擊(非追殺),順勢建立幾座「有目屋」;及(2)「削減對手的目數」:就是要破壞對手砌牆「有目屋」,使「有目屋」變成沒有目數的「沒目鷹」。其方法是拆掉它的一面牆,「有目屋」若少了一面牆就成了隻「沒目鷹」。 AlphpaGo Master慣用的破壞對手大模樣,使其為「沒目鷹」的手法,就是建立一條「無憂龍」。此「無憂龍」顛覆傳統圍棋在大樣裡「就地做活」的策略,而是在肆虐大模樣空地後,從中腹騰空而去,這是最經典的「現代流圍棋」。(詳見拙著「現代流圍棋:如何簡單對戰ALPHAGO-II (第一集)」第98頁─「現代流」第25局─「無憂龍」騰空而去,或視頻版現代圍棋學習之路─AlphaGo Master人機大戰(25/64)「無憂龍」騰空而去
最重要的,第一個「增加自己的目數」的決策優先於第二個「削減對手的目數」決策,也就是說,映該先致力於擴張自己的地域,再致力於破壞對手的地域,不可以看見對手的「大空」就眼紅要急著「破空」,因為既然「大空」可以被破,早晚需要補一手,所以「破空」是「後手」。
3)「不留弱棋原則」:「現代流5原則」的第3原則「不留弱棋原則」,這很重要,因為傳統圍棋的佈局及定式,基本上是苦心積慮留下孤子(味道),將來伺機蠢動,敗部復活。但這違反現代流的第三原則「不留弱棋原則」。因為依照棋理,所謂「弱棋」是已經無法棄掉的一塊棋子,而任何的弱棋,都會遭受對手的追殺,而失掉先機,而潰敗。例如,「現代流5原則對戰職業九段,9P系列(22─100)─ 陳華夫持白「Katrain 9段」留有弱棋被攻而輸了1目半」這一局,Katrain 九段貿然打入我的「大模樣」卻又不去補強,而留下弱棋,被攻擊,終局輸了1目半。
4)「走在外面原則」:是「現代流5原則」的第4原則。依照棋理,在19 x 19棋盤上,從底下算上來,落子在第四條線以上,就算是「走在外面(高位)」,落子在第1、2、3線的「走在裡面(低位)」。傳統圍棋落子棋盤角部時,偏好的位置是「小目」─座標(3,4),也就是一邊在裡面(低位),一邊在外面(高位)。而現代流的AlphpaGo Master偏好兩邊都在外面(高位)的「星位」─座標(4,4)。 並且,AlphpaGo Master慣用的「肩沖」─指落子在比對方棋子兩邊各高一線的位置─更是體現「走在外面原則」,尤其在佈局階段,「肩沖」是落子外邊,重視中腹,輕盈漂浮,腳步快速,不易被捕殺。但,AlphpaGo Zero等的電腦圍棋,喜好「開局進三三」,「三三」是個低為點,違反「走在外面原則」。我在我的視頻「科學方法學圍棋(11/40)─解謎「開局點三三」困惑」中,詳細解釋過,「開局進三三」並非是好棋,在實力相當的對弈,誰走「開局進三三」,誰的戰敗率大。而Katrain 九段非常喜歡「開局進三三」,我卻因此屢屢戰勝它。舉個實際的例子:「代流5原則對戰職業九段,9P系列(25─100)─陳華夫持白「Katrain 9段」開局進三三而大敗17目半」。此局就是Katrain 九段「開局進三三」導致早在白60手打劫後,就已大敗不可挽回了,終局輸入17目半。
5)「埋伏餘味原則」:這是現代流5原則的第5原則,是圍棋最高級的策略之一。所謂「埋伏餘味」就是看起來是一手隨手的壞棋,卻在數十手後卻變成致勝手,令對手防不勝防,而落敗。詳細請看:AlphpaGo Zero之棋力勝過AlphpaGo Master兩子的關鍵就是使用了「埋伏餘味」,AlphaGo Zero -40 block對戰AlphaGo Master(1/20)─迷你-高「AlphaGo Zero流」的持白「現代流5大手段」加上「埋伏餘味原則」威力強大。 而最近我持白與AI電腦圍棋「Katrain 9段」對戰的一局中,我白114手看起來是落入重圍的敗著,但到了白160手卻成了致勝手。但我必需坦白,以我的棋力是無法真正的做如此長遠的埋伏,多少有些誤打正著,所以提供給大家參考,詳細請看:現代流5原則對戰職業九段,9P系列(14/100)─ 陳華夫持白以埋伏餘味勝「Katrain 9段」一目半「人工智慧」的AlphaGo「圍棋革命」─圍棋的本質(1)
分享至
成為作者繼續創作的動力吧!
作者介紹
思想家─理解、解釋、預測世界。發表8篇「現代開悟之洞識」、11篇「開悟的本質」、13篇「美中關係」、6篇「驀然回首」、16篇「文學與藝術」、31篇「科技與智慧」、9篇「圍棋的本質」、40篇「美中經濟」、28篇「美股的本質」、12篇「美聯儲的本質」、12篇「貨幣及美元的本質」,共187篇。
本文發佈於
陳華夫專欄
思想家─理解、解釋、預測世界。發表:8篇美中關係、12篇「驀然回首」、16篇「文學與藝術」、26篇「科技與智慧」、7篇「圍棋的本質」、39篇「美中經濟」、21篇「美股的本質」、12篇「美聯儲的本質」、12篇「貨幣及美元的本質」,共152篇。


2收藏
分享