如果窮隊真的沒有希望,為什麼全隊薪資在職棒排名倒數第二的運動家隊,能贏得這麼多場比賽?──伏克爾向棒球委員會提出疑問。
《魔球》一書作者為Michael Lewis,記載美國職棒大聯盟(MLB)奧克蘭運動家隊的真實故事。該隊以小搏大,用數據思維選出一批從未被看好的球員,打出最瘋狂的佳績。他們重新思考了競賽的本質。本書也有一部同名電影《魔球》大家應該不陌生,由布萊德彼特主演。
魔球劇情都是真人真事,發生在2002年MLB奧克蘭運動家隊。運動家隊在該年賽季,拿下了破歷史紀錄的20連勝,不知輸球為何物。更戲劇性的是,他們花了最少的錢,用了最無名的球員,奪下分區龍頭老大。
這本是經典老書了,關於書中細節跟人物性格,大家應已多所討論。本文我只著重在「統計數據」與「新舊觀念衝突」兩部分。透過魔球的精神,反思今天科技時代下「人」或「人才」的價值,我也會表達我對一個大趨勢形成的看法。
統計的革命,對當今的我們來說不言可喻。人人明白數據帶來的決策價值。可是就我自己在數據科學領域中,我卻注意到數據卻沒能促成決策的改善。組織的決策經常違反數據,決策者經常不採用數據的洞見。
一個原因便是人們其實沒那麼相信統計數字。這點在書中有類似,90年代休士頓太空人隊 (Houston Astros) 曾向數據公司問及,如果他們把外野往內縮一些,情況會變得如何呢?不意外地分析指出,他們將輸掉更多比賽。但是太空人隊選擇直接將報告列為機密,維持外野內縮的想法,因為多些「全壘打」能刺激票房。
這就是最有趣的地方,面對數字時,人們會因為自己的預判或動機,產生截然不同的反應。主角運動家隊則是另一個鮮明的對比,他們把「賽伯計量學」的精神發揮到極致!
也就是說,比起只憑靠人的經驗(或偏見),他們更借重數字。總經理比利比恩(Billy Bean)、球探部主任庫波塔、研發部主任保羅˙迪波德斯塔 (Paul DePodesta)在球隊中發起革命。
在他們之前,主流棒球運動看重某種男子氣概。一名球員如果很能打全壘打,能盜壘,且身材健美容光煥發,就會更得到球探青睞。當然能長打能盜壘,算是一種合理的迷思,畢竟「感覺」起來很能贏球;至於外型刻板印象,則成了書中各方勢力衝突的核心。
2002年開季前選秀會,運動家球團辦公室就顯現出這種氛圍。眾球探人多口雜,想選這個想選那個,理由大不外乎是某位新秀高中畢業,年輕有潛力;或是外型好看,很能打。
但這看在總經理比恩眼中卻像無稽之談。畢竟他也是身材健美、十項全能的前MLB球員。但他在MLB只獲得極其平庸的表現,被球探捧上天然後重摔挫折。如今球探的各種溢美之詞,聽來非常刺耳。
而運動家隊的難處也很明顯,就是他們陣中的大將 Jason Isringhausen、Johnny Damon 和 Jason Giambi 即將離隊,他們沒有錢挽留大將,也沒有錢買同等的球員補缺。他們的任務是準確評估何種指標對得分最有幫助,以及量化球員在各方面影響得失分的程度。如此,他們才能拚出一個得失分差夠水準的陣容,贏得跟以前一樣多的比賽。
研發部的迪波德斯塔是關鍵,他是哈佛經濟系高材生,捧著一台電腦卻不怎麼能打球,受到球探輕視。他帶著一堆統計數字以及提高「上壘率」的精神,給出傳統眼中荒腔走板的選擇。他們看中職業圈沒人關注的球員,一次又一次,將珍貴選秀順位讓給那些球探眼中的三流球員。球探們不以為然,要不是重傷球員身材肥胖,要不就是譏笑他們不太能打全壘打。
書中說迪波德斯塔簡直是異端,他把70–80年代詹姆斯派的數據觀點推展到全新境界。那年熱中於棒球數據分析的詹姆斯,就提出上壘率很重要的觀點(當時職業圈完全不在意這點),然迪波德斯塔更指出上壘率的價值「是長打率的三倍」;同時他精準預測團隊得分的公式,裡面居然沒有包含觀眾愛看的盜壘!他的結果比前人更明確,更新穎瘋狂。
他們翻轉了曾經人們以為重要的東西,建立了新的指標,並重新定義了問題:
……。真正的問題,是棒球隊一開始要如何找到明星,以及失去明星後,能否找到新人取而代之?到底該如何評估一個棒球員的可替代性?簡短版的答案是:比經營棒球隊的那些人以為的要容易替代得多。
這數據派的大改革事後看是十分成功的,運動家隊連贏20場破歷史紀錄,單季103勝也比一個賽季2001年多8勝。數據棒球的見解,也讓棒球界關注全新統計指標,今天大家甚至開發出更多新指標,以衡量球員的貢獻。
不只是勝利本身,魔球的精神也給人很多啟發。首先是研發精神,他們非常在意「問題」本身,像是如果全隊都是同一個人打擊,那最後一整季能得幾分;或如果要一季要贏95場,得分必須比失分高出多少?
其次是行程可執行的洞見──儘管與事實違背,像是數據指出要得分其實來自夠高的上壘機率(而非狂轟全壘打),那他們應該選擇選球能力很強的人,儘管這個特質很沒有「男子氣概」;而且不能硬選愛揮大棒的人,他們沒辦法透過後天學習選球這個技能。
這是我們在這個世界必須學習的:定義問題、驗證假設,形成可執行的洞見。至少從科學和生產力的角度來看是這樣。今天我們特別感覺到人工智慧取代人類的壓力,我想正源自於我們對人類的優點並不那麼自信。可人最有價值的其實就在魔球精神,透過簡約化運作邏輯,並驗證想法可行。
電腦確實擁有很強算力,但他可沒有你這麼會思考、推理和歸納。再聰明的電腦,也沒辦法像迪波德斯塔有洞見,正因迪波德斯塔懂得世界(球場)運作的基本原則,他透過抽象的代數和機率,描述原則與其演變。
抽離掉代數和機率等工具性詞彙,我們最基本的是正確理解事物背後原則,和描述與推演後續變化。即便你不會什麼數學,你總會畫圖或寫字吧?這就是我們具有的表述能力,不要被得學什麼東西或非用什麼工具不可而綁住,關鍵是,我們是否對事情/世界運作的邏輯有所掌握。
我可以說目前的AI,不具備對特定場域或物理世界運作的邏輯。他能說出一些話,畫出一個世界,但AI必定不理解為什麼這些東西該長這樣。沒錯,一旦不能掌握基本物理原則,理解與描述眼前現象,他就沒有創造力,就無法取代你。只不過相反過來,人一旦放棄思考世界,放棄掌握事物運作的原理,就要成為AI底下的廢物人口──既沒有理解力、創造力,腦袋運轉速度還比電腦慢。
我另外還想指出,一個新概念的形成需要環境配合,也就是「環境先於成果」。以魔球的形成背景來說,數據棒球或「賽伯計量學」要追溯至西元1977年的詹姆斯。詹姆斯熱切在幾年內推廣用數據思考棒球,提出統計觀點,從最初25名讀者,到棒球迷普遍談論他的論述。
然而這一切屬於觀念孵化期,只算是非主流活動。一直要到有商業、技術和資本關照,事情才會進到應用端和改變世界的層級。當然詹姆斯和他同夥創辦 STATS Inc. 自身就是一個契機。他們不滿足於普通數據,反而收集更大量更細節的數據以提供實務見解,例如「打者打出二壘安打」這種紀錄就太過粗糙,他們更要知道擊球的初速、軌跡,還有他們自己規格化分割出來的球場落點。
挺過1990年代的這波,才帶出了一批善於數學與經濟的人,投入科學棒球中,他們看見了職業棒球的荒謬和不效率。魔球孕育自這樣的背景,一個大膽瘋狂的總經理比恩,跟著這批人才合作,才創造了2002年的故事。
所以完全雷同地,我們看待產業發展也不能用急躁的心,反而要看是不是有足夠的先天條件和資源累積,找出成功的條件和約束。每件事都不會憑空出現,也不會只靠砸錢就成功。以AI來說,沒有硬體上下游整合的台灣,輝達就會在研發進程上會大有推遲;沒有數位化跟運算力,就不會有機器學習的應用──現象有其根本。我們需要耐心,也需要挑戰傳統的勇氣。
這大概就是我看完魔球這本老書後,對最新趨勢的看法。歷史不會重複,但是會押韻,應該就是這個道理。
你問魔球是不是成功的,一定是。現在MLB各大球隊幾乎都養著一個數據團隊,數據派的思想也在這幾年占上風。書中提到的數據派管理人員艾普斯坦(Theo Epstein)後來成為芝加哥小熊隊的總經理,他們的方法幫助球隊在2016年拿下睽違108年的冠軍。
運動家制服組看上(但被球探們譏笑肥胖)的尤基里斯(Kevin Youkilis),他日後果真也成為波士頓紅襪隊王朝的主戰成員,當時信奉數據的紅襪隊管理者,跟比恩搶奪尤基里斯,打算以他為中心組建打線。
結論而言,在傳統觀念盛行的棒球領域,新決策思維的成功引發非常強大的張力。魔球的特別在於,面對棒球領域新舊觀念的交替,以非常戲劇性的方式在2002年運動家隊身上開花結果。
魔球的故事,看電影有張力,看書有細節,看歷史有應驗的一個經典故事,雖然是老書/電影了,但我還是一推再推。
《魔球》書籍連結:https://www.books.com.tw/web/sys_serialtext/?item=0010522666&page=4