本指南提供給有興趣深入NBA數據的球迷,如何逐步探索NBA的數據環節並與看球經驗相結合,進一步去體現並驗證對球賽的認知。
職業運動的本質是娛樂產業,每個球迷都有權力選擇他從中獲得樂趣的方式,因此如果你已經對現況感到滿足,其實也沒有什麼不好。(update: Oct 2021)
動態捕捉技術與生物監測設備的導入,可以說是近十年催熟各職業運動的最大推手。在NBA除了人所皆知的大三分效率時代外,其實防守策略的重新評估與執行,才是近年來最顯著的改變。
同時走在前端的球隊,其數據模擬已經詳盡到能夠消弭球員待在強弱聯盟的成績誤差,以及模擬球員扮演不同戰術角色時的轉換表現。但這並不代表球迷亦能利用公開的有限數據做出類似的效果。
球迷判讀比賽的三位一體:數據、戰術、戰技
數據對球迷來說很好用,它可以彌補戰技判讀並輔助驗證戰術成效,但其易懂難精的特性,也是最容易被濫用以及錯誤解讀的。
網路上看似能對聯盟中30隊輕鬆侃侃而談的業餘評論者,多是靠數據與參考他人心得去填補對比賽的攝取不足。如果你是特定球隊的球迷,相信多少會有類似的體悟:這些看似全能的業餘評論者,其實並無法精確描繪出每隻球隊的總體戰略規劃與次級戰術角色,部分甚至連大方向論述都有問題。
這便是過於依賴數據的盲點。每一項數據就像是一個摸象的盲人,每一項產出都是基於片面事實,但想像跟最後張開眼睛看到的總是有差距。球隊可以派出一百位盲人摸透大象全身上下,但球迷上限僅十位而且限定站在平地用單手摸,部分速食型評論更是只看進階數據便鐵口直斷。
1.0:學習Basketball Reference
免費數據網站:Basketball Reference
官方NBA stats(以下簡稱官網)提供的內容雖然最多,但Basketball Reference(以下簡稱BR)整理出的一頁式瀏覽方便太多了。
BR由上到下的數據羅列方式也比較適合球迷逐步深入。一般來說,球迷學習數據的過程都是先搞清楚Box Score(賽後統計)裡面的定義,之後再開始往Per Game(場均)、Per 36 Mins、Per 100 Poss向下延伸,並將統計學的概念慢慢帶入。
BR跟官網的數據會略有出入,不過大部分情況下無礙使用。學習順序建議如下:
球隊主頁面 → 球員主頁面 → 球員子頁面(Splits / Shooting / On&Off)
數據培樂多:Crafted NBA
最接近NBA 2k、讓球迷能輕鬆獲得樂趣的數據網站。Crafted NBA是個把各種公開數據捏作團、塑形成一頁式球員報告的網站。
2.0:學習NBA stats、PBP stats
免費數據網站:NBA stats、PBP stats
收費動態數據網站:Synergy
官網提供了比BR更細的內容:Playtype, Tracking, 以及各種陣容的正負值表現。如果你有好好玩過一輪BR的話,官網這些新的內容就像遊戲資料片一樣,很快上手。
PBP stats則是把官網的所有回合細節抓下來再組合回去,因此你可以在這個網站上找到官網沒有直接提供的分類項,更深入的從中剝離出你想驗證的特定情境細節。
但這些新型態的內容亦加劇了球迷的數據濫用。很多人只是取用卻沒有清楚地去瞭解這些的數據成因與盲側(blind side),也沒有足夠的戰術素養以得分以外的事情去反向驗證。近年最容易被濫用的數據前三甲:官網免費版Playtype、正負值系列(Plus/Minus)、USG%。每一項的內容均足以能獨立開一篇文章解釋。
正負值進階數據:DPM、EPM、LEBRON、RAPTOR
以上四項正負值進階數據,是2021年NBA業內認為最具參考價值的公開數據。原文可點擊下方連結,或閱讀我於ptt分享的
中文版簡介。
2.5:使用未對一般球迷開放的數據系統
NBA合作動態追蹤系統:Second Spectrum
當然實際存在的不只這一套系統,但
Second Spectrum可以說是最為廣為人知的。NBA官網上有關動態追蹤(Tracking)的資料都是這套系統擷取出來的。其系統不管在UI還是即時回饋上,私以為都比開放給球迷訂閱的
Synergy強。
- 尚未開放供球迷/個人購買。
- The Athletic跟FiveThirtyEight的部分作者寫作時會使用此系統。
- 快艇轉撥單位FOX跟全國ESPN部分直播時用的AR便是使用此技術呈現。
3.0:重新檢視數據定義,學習合理的使用數據推論
免費數據網站的術語解說表:NBA stats、Basketball Reference
這個階段相信你已經把官網跟BR的頁面翻過好幾輪了。如果有好好閱讀數據說明,並配合統計學概念與看球經驗去反覆推敲的話,以下這幾點對你來說應該是常識。
- 知曉幾個著名進階數據的組成公式與缺陷。
- 部分數據使用上會存在局限性,如某些數據適用於球隊,不適用於個人;某些數據適用於進攻評估,但反過來驗證防守會有很大問題。
- 得分之外的內容不易單靠公開數據去準確評估。就算透過多項數據反覆推敲,得到的結果依然需要與看球經驗相互驗證。
- 一些能輔助驗證的數據官網不會直接提供,需要自己簡單加工處理。
網路上已公開的數據庫中,尚沒有任何一套分數能完整評判球員的整體影響力。
個人心目中最理想的方式是參照美式足球的PFF作法,解構出所有的回合並且針對每次的獨立行為評分,而非以結果數據加工計算。(詳見
連結說明)
4.0:從真正的專家身上學習如何檢視與解構數據
MIT史隆數據分析大會(SSAC):網站、Youtube
數據球迷的集散地:Nylon Calculus
曾在業界打滾過的專家:Seth Partnow、Justin Jacobs
MIT史隆數據分析大會(SSAC)可以說是運動分析界的年度盛會,NBA球隊中最頂尖的數據專家基本上都會出席該會議或參與講座。如果你沒有數據分析方面的背景,可以從Youtube上你有興趣的名人講座開始看起,除了英文能力有要求之外,其內容並不會很艱澀難懂;若行有餘力,再來翻翻每年投稿的論文,裡面有很多有趣的分析且不限於籃球領域。
如果還嫌不夠過癮,那
Justin Jacobs的網站非常值得去逛一逛。
Justin Jacobs是位數據分析博士,曾任職於魔術隊,也擔任過某隻西部球隊的統計顧問。他會以寫論文的精神從頭探討每個數據議題,沒有專業打底的讀者可能會覺得很硬,但這就是真正的把數據玩出價值。目前為止個人還沒有看過其他質量能比肩的網站。