把李世乭打到退出棋壇的神秘高手 - AlphaGo

史塔克實驗室

更新於 2023/02/01發佈於 2020/09/24閱讀時間約 6 分鐘

其實我標題很想下: 把高永夏打到退出棋壇的神秘高手 — Alphago

高永夏是棋靈王的虛構人物，原型是韓國職業棋士高手李世乭

在2016年人機圍棋大戰之後，李世乭被Alphago打到懷疑自我，因而產生退出職業棋士一路的想法

AlphaGo到底何許人也？

AlphaGo是一個機器裡面搭載了當時最強最新的演算法

AlphaGo 使用了蒙地卡羅樹狀演算法結合二個深度神經網路的圍棋程式

讓他不斷的學習圍棋直到擁有最強的下法，形成一個專形成一個專門下圍棋的程式。一開始的時候其實很多棋士都小看它。都覺得不太可能贏人類，像是台灣的紅面棋王覺得他只是一個炒作，李世乭在對戰之前也是覺得自己不可能會輸，直到他下營李世乭之後大家才開始知道自己下不贏電腦了。

AlphaGo的優勢就是來自龐大的運算資源跟速度

憑藉大量儲備的棋局，透過透過勝負機率來判斷下一步著點，以作為計算方向提高了自身的勝率。

AlphaGo的另一個優勢是他沒有情緒波動

能高度集中選擇勝率最高的著棋點，電腦不會有追求完美的想法，他被教導的只有勝率。他不會像人類一樣在思考著一百分的著棋點在哪裏，電腦是思考最高勝率的點在哪。但也因為這樣，如果資料裡看到沒有下過的招數也有可能落敗，因為電腦是根據過去他所學習的棋譜。去推算對手可能下的齊步，然後進行塞選跟過濾，然後來對未來的齊步做規劃。

AlphaGo走棋的方式

AlphaGo下棋主要分成三個步驟，第一步會掃描棋子擺放情況並從中找出可行的落點，第二步從每個可行的落點建構出預測棋步的樹狀圖，第三步在對每個樹狀的分支計算勝率並找出最大獲勝機率的落點。

當年DeepMind用蒙地卡羅演算法加上二個神經網路創造出這個厲害的圍棋機器。

其實就算alphago已經打敗眾多人類高手下，對科學家而言還是有很大的進步空間。所以在AlphaGo挑戰完世界棋王之後，又歷經了幾次升級並成為了最新版的－「AlphaGo Zero」，這個系統則不再需要透過人類進行訓練，也不再倚靠人類的知識，即為它不再需要人類的幫忙與訓練，並且也已不再僅侷限於圍棋，而是可以在各項棋類活動、競賽中大展身手。這其實也意謂著：為未來的人工智慧將有無限可能的發展。

需要好好思考圍棋的本質

在李世乭輸掉之後，人們開始反思自己下棋的本質，棋盤上每一步，反映的是下棋人的思考、受過訓練等個人內涵，否則就不會有那一步棋。棋譜只是非常簡略的記號，不足以表達下棋過程的內在思維，即便是旁觀者的說明講解，也有很大一部分出自個人想像力，只是過去大家都接受這種方式，也相信歸納出來的下棋原則。

AlphaGo出現以後，完全推翻了過去認定的正確原則，棋譜上各個棋步，出現了與以往完全不同意涵。可以說，AlphaGo切斷了棋譜與傳統詮釋的關連性。

「追求最高境界」是圍棋產業的最重要目標嗎？圍棋本質在於兩方對弈、交流過程的樂趣，不一定要追求最高境界。台灣業餘圍棋的健壯發展，台灣旅日職業棋士王銘琬形容是「很偉大的事情」，不必因職棋表現不夠強而自卑。

創始團隊的本意

起初DeepMind 研發的人工智慧，不是為了打敗世界上最聰明的人，而是想找出一體適用的方式，讓電腦能夠從零開始學習任何知識、技術，透過自我學習，持續地調整與改進。AlphaGo只是一個弱人工智慧，還沒有到達什麼都能學的境界; 人機對戰也只是測試這套系統，能否克服公認最難的棋類遊戲，AlphaGo變成世界第一圍棋高手，只是順便發生的「意外」，證明它能解決複雜度極高的難題。或許這個專案關閉之後也才邁入人工智慧啟蒙期的結束，AlphaGo的退役，是另一個新的開始。