NBA專業球迷煉成指南:數據101

2019/07/29閱讀時間約 7 分鐘
本指南提供給有興趣深入NBA數據的球迷,如何逐步探索NBA的數據環節並與看球經驗相結合,進一步去體現並驗證對球賽的認知。
職業運動的本質是娛樂產業,每個球迷都有權力選擇他從中獲得樂趣的方式,因此如果你已經對現況感到滿足,其實也沒有什麼不好。(update: Oct 2021)
動態捕捉技術與生物監測設備的導入,可以說是近十年催熟各職業運動的最大推手。在NBA除了人所皆知的大三分效率時代外,其實防守策略的重新評估與執行,才是近年來最顯著的改變。
同時走在前端的球隊,其數據模擬已經詳盡到能夠消弭球員待在強弱聯盟的成績誤差,以及模擬球員扮演不同戰術角色時的轉換表現。但這並不代表球迷亦能利用公開的有限數據做出類似的效果。

球迷判讀比賽的三位一體:數據、戰術、戰技

數據對球迷來說很好用,它可以彌補戰技判讀並輔助驗證戰術成效,但其易懂難精的特性,也是最容易被濫用以及錯誤解讀的。
網路上看似能對聯盟中30隊輕鬆侃侃而談的業餘評論者,多是靠數據與參考他人心得去填補對比賽的攝取不足。如果你是特定球隊的球迷,相信多少會有類似的體悟:這些看似全能的業餘評論者,其實並無法精確描繪出每隻球隊的總體戰略規劃與次級戰術角色,部分甚至連大方向論述都有問題。
這便是過於依賴數據的盲點。每一項數據就像是一個摸象的盲人,每一項產出都是基於片面事實,但想像跟最後張開眼睛看到的總是有差距。球隊可以派出一百位盲人摸透大象全身上下,但球迷上限僅十位而且限定站在平地用單手摸,部分速食型評論更是只看進階數據便鐵口直斷。

1.0:學習Basketball Reference

免費數據網站:Basketball Reference
官方NBA stats(以下簡稱官網)提供的內容雖然最多,但Basketball Reference(以下簡稱BR)整理出的一頁式瀏覽方便太多了。
BR由上到下的數據羅列方式也比較適合球迷逐步深入。一般來說,球迷學習數據的過程都是先搞清楚Box Score(賽後統計)裡面的定義,之後再開始往Per Game(場均)、Per 36 Mins、Per 100 Poss向下延伸,並將統計學的概念慢慢帶入。
BR跟官網的數據會略有出入,不過大部分情況下無礙使用。學習順序建議如下:
球隊主頁面 → 球員主頁面 → 球員子頁面(Splits / Shooting / On&Off)
數據培樂多:Crafted NBA
最接近NBA 2k、讓球迷能輕鬆獲得樂趣的數據網站。Crafted NBA是個把各種公開數據捏作團、塑形成一頁式球員報告的網站。

2.0:學習NBA stats、PBP stats

免費數據網站:NBA statsPBP stats
收費動態數據網站:Synergy
官網提供了比BR更細的內容:Playtype, Tracking, 以及各種陣容的正負值表現。如果你有好好玩過一輪BR的話,官網這些新的內容就像遊戲資料片一樣,很快上手。
PBP stats則是把官網的所有回合細節抓下來再組合回去,因此你可以在這個網站上找到官網沒有直接提供的分類項,更深入的從中剝離出你想驗證的特定情境細節。
但這些新型態的內容亦加劇了球迷的數據濫用。很多人只是取用卻沒有清楚地去瞭解這些的數據成因與盲側(blind side),也沒有足夠的戰術素養以得分以外的事情去反向驗證。近年最容易被濫用的數據前三甲:官網免費版Playtype、正負值系列(Plus/Minus)、USG%。每一項的內容均足以能獨立開一篇文章解釋。
正負值進階數據:DPMEPMLEBRONRAPTOR
以上四項正負值進階數據,是2021年NBA業內認為最具參考價值的公開數據。原文可點擊下方連結,或閱讀我於ptt分享的中文版簡介

2.5:使用未對一般球迷開放的數據系統

NBA合作動態追蹤系統:Second Spectrum
當然實際存在的不只這一套系統,但Second Spectrum可以說是最為廣為人知的。NBA官網上有關動態追蹤(Tracking)的資料都是這套系統擷取出來的。其系統不管在UI還是即時回饋上,私以為都比開放給球迷訂閱的Synergy強。
  • 尚未開放供球迷/個人購買。
  • The Athletic跟FiveThirtyEight的部分作者寫作時會使用此系統。
  • 快艇轉撥單位FOX跟全國ESPN部分直播時用的AR便是使用此技術呈現。

3.0:重新檢視數據定義,學習合理的使用數據推論

免費數據網站的術語解說表:NBA statsBasketball Reference
這個階段相信你已經把官網跟BR的頁面翻過好幾輪了。如果有好好閱讀數據說明,並配合統計學概念與看球經驗去反覆推敲的話,以下這幾點對你來說應該是常識。
  • 知曉幾個著名進階數據的組成公式與缺陷。
  • 部分數據使用上會存在局限性,如某些數據適用於球隊,不適用於個人;某些數據適用於進攻評估,但反過來驗證防守會有很大問題。
  • 得分之外的內容不易單靠公開數據去準確評估。就算透過多項數據反覆推敲,得到的結果依然需要與看球經驗相互驗證。
  • 一些能輔助驗證的數據官網不會直接提供,需要自己簡單加工處理。
網路上已公開的數據庫中,尚沒有任何一套分數能完整評判球員的整體影響力。
個人心目中最理想的方式是參照美式足球的PFF作法,解構出所有的回合並且針對每次的獨立行為評分,而非以結果數據加工計算。(詳見連結說明)

4.0:從真正的專家身上學習如何檢視與解構數據

MIT史隆數據分析大會(SSAC):網站Youtube
數據球迷的集散地:Nylon Calculus
曾在業界打滾過的專家:Seth PartnowJustin Jacobs
MIT史隆數據分析大會(SSAC)可以說是運動分析界的年度盛會,NBA球隊中最頂尖的數據專家基本上都會出席該會議或參與講座。如果你沒有數據分析方面的背景,可以從Youtube上你有興趣的名人講座開始看起,除了英文能力有要求之外,其內容並不會很艱澀難懂;若行有餘力,再來翻翻每年投稿的論文,裡面有很多有趣的分析且不限於籃球領域。
Nylon Calculus則是數據球迷的集散地,作者來自四面八方,因此產出內容較無特定面向,有時深入有時小品。由於採取編輯審核制度的關係,因此有一定的質量控管。個人覺得產出的面向與觀點相對比FiveThirtyEight有創意。
Nylon Calculus前編輯Seth Partnow之前被公鹿隊挖去擔任數據研究工作三年多,於2019年七月離開,並宣佈加入The Athletic。他會定期針對聯盟的整體現象進行深入淺出的分析並以數據圖表解釋,可說是The Athletic數據分析的第一把交椅。
如果還嫌不夠過癮,那Justin Jacobs的網站非常值得去逛一逛。Justin Jacobs是位數據分析博士,曾任職於魔術隊,也擔任過某隻西部球隊的統計顧問。他會以寫論文的精神從頭探討每個數據議題,沒有專業打底的讀者可能會覺得很硬,但這就是真正的把數據玩出價值。目前為止個人還沒有看過其他質量能比肩的網站。
關於NBA與NCAA男子籃球的觀察心得及意見筆記。
留言0
查看全部
發表第一個留言支持創作者!