Regularized Adjusted Plus-Minus (RAPM)
由於APM只用誤差最小平方法進行估算
若有球員表現呈高度相關性
則會出現多重共線性的問題
導致不同球員估算的正負值有劇烈的浮動
有的絕對值十分巨大 有的則趨近於0
此時可以在誤差最小平方合的矩陣外
額外加入λx正負值反矩陣x正負值矩陣
(可以想像成λx正負值平方和)
利用懲罰項λ讓正負值不會出現絕對值異常大的情況
這種作法稱為嶺回歸(ridge regression)
這也是RAPM以及許多新的籃球數據模型的基本方式
除了ridge regression之外
還可以加入幸運值的影響(luck-adjusted RAPM)
舉例來說隊友和對手罰球命中率不會受個別球員能力影響
但不同的命中率會影響球員的正負值
這個也能透過luck-adjust調整
小結
自從PER問世以來 進階數據已隨著資料科學的進步蓬勃發展。
除了引用基本數據做為公式之外
新的進階數據更像是透過新數據不斷修正的模型
有的主打動態數據 有的加入幸運值 有的則是能預測未來發展
甚至還有利用機器學習建立的模型
今天介紹的RAPM是很多先進模型會引用的
其實進階數據背後有很多數學以及原理
若能稍加研究
就能推斷出各個數據的優缺點以及適用範圍
個人覺得比起純粹比數字大小有趣多了XD
延伸閱讀
RAPM介紹
https://reurl.cc/Mk4Qyp
Ridge Regression (youtube 影片)
https://reurl.cc/V5NxNy
Luck-adjusted ratings
https://reurl.cc/OkGNGy