2020-09-24|閱讀時間 ‧ 約 7 分鐘

把李世乭打到退出棋壇的神秘高手 - AlphaGo

其實 我標題很想下: 把高永夏打到退出棋壇的神秘高手 — Alphago
高永夏是棋靈王的虛構人物,原型是韓國職業棋士高手李世乭
在2016年 人機圍棋大戰之後,李世乭被Alphago打到懷疑自我,因而產生退出職業棋士一路的想法

AlphaGo到底何許人也?
AlphaGo是一個機器裡面搭載了當時最強最新的演算法
AlphaGo 使用了蒙地卡羅樹狀演算法結合二個深度神經網路的圍棋程式
讓他不斷的學習圍棋 直到擁有最強的下法,形成一個專形成一個專門下圍棋的程式。一開始的時候其實很多棋士都小看它。都覺得不太可能贏人類,像是台灣的紅面棋王覺得他只是一個炒作,李世乭在對戰之前也是覺得自己不可能會輸,直到他下營李世乭之後 大家才開始知道自己下不贏電腦了。
AlphaGo的優勢就是來自龐大的運算資源跟速度
憑藉大量儲備的棋局,透過透過勝負機率來判斷下一步著點,以作為計算方向 提高了自身的勝率。
AlphaGo的另一個優勢是他沒有情緒波動
能高度集中選擇勝率最高的著棋點,電腦不會有追求完美的想法,他被教導的只有勝率。他不會像人類一樣在思考著一百分的著棋點在哪裏,電腦是思考最高勝率的點在哪。但也因為這樣 ,如果資料裡看到沒有下過的招數也有可能落敗,因為電腦是根據過去他所學習的棋譜。去推算對手可能下的齊步 ,然後進行塞選跟過濾,然後來對未來的齊步做規劃。

AlphaGo走棋的方式
AlphaGo下棋主要分成三個步驟,第一步會掃描棋子擺放情況並從中找出可行的落點,第二步從每個可行的落點建構出預測棋步的樹狀圖,第三步在對每個樹狀的分支計算勝率並找出最大獲勝機率的落點。
當年DeepMind用蒙地卡羅演算法加上二個神經網路創造出這個厲害的圍棋機器。
其實就算alphago已經打敗眾多人類高手下,對科學家而言還是有很大的進步空間。所以在AlphaGo挑戰完世界棋王之後,又歷經了幾次升級並成為了最新版的-「AlphaGo Zero」,這個系統則不再需要透過人類進行訓練,也不再倚靠人類的知識,即為它不再需要人類的幫忙與訓練,並且也已不再僅侷限於圍棋,而是可以在各項棋類活動、競賽中大展身手。這其實也意謂著:為未來的人工智慧將有無限可能的發展。

需要好好思考圍棋的本質
在李世乭輸掉之後,人們開始反思自己下棋的本質,棋盤上每一步,反映的是下棋人的思考、受過訓練等個人內涵,否則就不會有那一步棋。棋譜只是非常簡略的記號,不足以表達下棋過程的內在思維,即便是旁觀者的說明講解,也有很大一部分出自個人想像力,只是過去大家都接受這種方式,也相信歸納出來的下棋原則。
AlphaGo出現以後,完全推翻了過去認定的正確原則,棋譜上各個棋步,出現了與以往完全不同意涵。可以說,AlphaGo切斷了棋譜與傳統詮釋的關連性。
「追求最高境界」是圍棋產業的最重要目標嗎?圍棋本質在於兩方對弈、交流過程的樂趣,不一定要追求最高境界。台灣業餘圍棋的健壯發展,台灣旅日職業棋士王銘琬形容是「很偉大的事情」,不必因職棋表現不夠強而自卑。

創始團隊的本意
起初DeepMind 研發的人工智慧,不是為了打敗世界上最聰明的人,而是想找出一體適用的方式,讓電腦能夠從零開始學習任何知識、技術,透過自我學習,持續地調整與改進。AlphaGo只是一個弱人工智慧,還沒有到達什麼都能學的境界; 人機對戰也只是測試這套系統,能否克服公認最難的棋類遊戲,AlphaGo變成世界第一圍棋高手,只是順便發生的「意外」,證明它能解決複雜度極高的難題。或許這個專案關閉 之後也才邁入人工智慧啟蒙期的結束,AlphaGo的退役,是另一個新的開始。
和這個主題有關的podcast 也上線了 歡迎大家去收聽
FB: https://reurl.cc/WL19r9 Podcasts: Apple: https://reurl.cc/D63Dz6 SoundOn: https://reurl.cc/n0OXad Spotify :https://reurl.cc/XkV3dR
如果想知道高永夏是誰….可以看看這幾篇文章

分享至
成為作者繼續創作的動力吧!
台灣大學電機博士 曾任職台積電半導體工程師 目前在在博士班致力於將金融數據科學與資料工程的研究
© 2024 vocus All rights reserved.