史隆運動分析論壇(MIT SSAC),是北美運動數據研究圈中最重要的交流盛會,許多的運動數據分析人才與業界相關公司,都是透過此論壇所發跡。
以下為個人對SSAC 21入選論文的簡述。引言則是個人觀點。
樣本採集與建模
1. 這份論文將數據建模的最小單位細分到幀。
2. 預期聯盟中有建立數據班的球隊,都有一套類似的球員評估系統。
- 海量數據。作者群利用SSAC前一年論文無需安裝球場設備的影像動態捕捉技術,擷取了超過65萬個回合、300萬幀的NCAA D1電視轉播賽事動態數據。
- 進攻端,採用擬似影片剪輯的多軌模式進行動態數據建模。
- 防守端,建模則是對位距離為主、再搭配場上各式行為與對位球員調整權重。
- 最大的挑戰是大學比賽場次過少,就算打滿整個賽季,球員的樣本數依然偏低。因此作者群混合了Kevin Pelton開發的大學權重系統進行校正。
- 混合模型的產出預期結果,較原始模型或傳統的進階數據來得更穩定。
選秀價值評估
作者群很有野心,原本想做出的是新秀NBA前三年的上場時間預測模型。
- 使用球員於大學時期的數據與中選順位去建模,不採用任何NBA數據。
- 不使用任何人為參數,如選秀模擬榜單等,純粹靠大學產出數據判斷。
- 使用VORP進行選秀位置分梯,依照差值,將選秀籤順位劃為以下九檔。
論文中所舉的球員模擬案例
1. 相較球員等級評等,這個系統更傾向球隊在不同級距有不同的表現權重偏好。
2. 相較球隊,球員經紀公司預期更青睞此系統,藉以拿來評估潛在簽約客戶。
- Jayson Tatum (2017梯,選秀順位3)
>95%落於3~5順位
- Aaron Nesmith (2020梯,選秀順位14)
13%落於13~17順位|62%落於18~26順位|25%落於27~39順位
- Shabazz Muhammad (2013梯,選秀順位14)
45%落於13~17順位|32%落於18~26順位|20%落於27~39順位
其他籃球入選論文