史隆運動分析論壇(MIT SSAC),是北美運動數據研究圈中最重要的交流盛會,許多的運動數據分析人才與業界相關公司,都是透過此論壇所發跡。
以下為個人對SSAC 20入選論文的簡述。引言則是個人觀點。
成為核心得分手潛值較低的新秀,在選天賦不選位置的選秀策略下容易吃虧。
首先,作者利用多種數據分類出九種新型態的球員類型。
- 多數球員都能直接套用特定的角色分類,少數球員為混合型。
- 分類統計以單季表現為單位。基於球隊所給予的任務與自身能力成長,球員可能會在兩季之間擔任不同的角色。
- 預估貢獻值是大樣本下的常態評估,但各類型其實都能產出明星級選手。
接著,作者將2009 - 2018賽季的所有上場陣容進行消除雜訊處理,取樣後以機器學習(Random Forests)的方式去模擬了310萬個可能陣容的可能淨得分(Net Rating)。
- 模型建議以核心得分手 + 無球射手打造陣容。擁有一位核心得分手、兩位延伸型前鋒便能帶來高效表現;反之,若陣容中無此兩類球員,則表現多半不好。
- 大部分陣容需要配至少一位高使用率後衛(核心得分手/地板型後衛/高使用率後衛)負責持球;延伸型前鋒可以取代萬金油球員。
- 最高淨貢獻值(+14.5 ~ +15.5)的陣容組成:
1.25核心得分手 + 2.25萬金油球員 + 0.5延伸型前鋒 + 1傳統型大個
- 勇士17年(+12.4)的死亡五小陣容:
2核心得分手(SC、KD) + 1射手型後衛(KT) + 2萬金油球員(DG、AI)
- 最低淨貢獻值(-10.7 ~ -10.3)的陣容組成:
0.25地板型後衛 + 2高使用率後衛 + 2.25萬金油球員 + 0.5技巧型前鋒
立意良好,但算式複雜、球迷難以直觀理解是最大問題。
個人以為採用2005-2018樂透規則,再引進熔斷機制即能成為更務實的選秀模型。
作者認為,只要樂透機率規則是根據最終排名計算,則永遠無法杜絕球隊擺爛;所有非季後賽球隊的抽籤機率相同也是問題,實力較弱的球隊無法有效補強。因此作者提出的新機制有著兩大特點:
- 動態遞迴。從賽季的第一場比賽開始動態計算樂透機率。其運算式假設所有球隊實力相等,若球隊實力有落差,則可透過如賭盤預測等機率去校准參數,精準定義弱隊並提高樂透中籤機率。
- 熔斷機制。當勝場差距大到中後段球隊覺得擺爛比爭奪季後賽席次更有價值時,則鎖死樂透機率,避免中段球隊技術性躺平與弱隊搶選秀權。
- 該技術可以直接分析電視轉播,得到準確率相當高的動態捕捉數據。分析測試上,該程式抓取的球員移動軌跡與Second Spectrum紀錄相比,吻合度高達92.1%。分析動態數據的同時亦能抓取計分板,一併建立時間軸與得分紀錄。
- 校正基準是是透過「油漆區」、「罰球半圓區」與中場「Logo」的相對位置去做距離定位。
- 該技術將大幅降低動態數據抓取的成本,帶給業餘籃球幫助,但仍有改進空間。目前最大的問題是無法精準抓取球的移動軌跡,因此提供的內容受限。
其他籃球入選論文