作者:
timmyen (new life)
2021-04-30 09:43:54今天早上在reddit看到的文章,覺得挺有趣,轉過來跟版友們分享。
小弟不是學資料科學的,如果內文有誤也請不吝指正
原文:https://perthirtysix.com/essay/2021-nba-mvp-race
懶人包:
作者(u/robmoo_re)利用了過去38年的NBA的球員資料以及MVP票選結果(包含排名及票數)
建造了一個預估球員得到MVP的機率以及MVP得主的模型,
利用這個模型,在過去38年中可以正確的計算出32年的得主。
在這個模型中,各項球員數據的權重(也就是這個模型認為影響MVP票選最重要的數據)
依序如下:
https://imgur.com/33ouqUG
球隊勝率%
每場上場時間
球隊種子序
WS/48
每場得分
出賽場次
VORP
2分命中率
罰球次數
助攻數
每場籃板
整體命中率
BPM
Usage%
每場失誤數
真實命中率
(以下不列,可以自己看圖)
模型利用以上數據算出每一個球員的candidacy score
這個分數越高者,即是模型認為越有可能得到MVP的人選
要特別說的是,某些數據本身是互相有關聯性的(譬如:兩分/三分命中率及整體命中率,
或是整體命中率跟一大堆進階數據),由於已經被重複計算過,因此單項的權重會降低,
不代表這項數據就不重要。
===
幾個有趣的結果
1. 誰是這38年來MVP分數最高的球員?
答案是08-09年的姆斯,分數高達4.49
2. 那最低分的MVP得主又是誰?
答案是04-05年的Nash,他當年的分數只有1.09
3. 誰的MVP被偷了?(誤)
剛剛提到38年中這個模型成功預測出32年的MVP得主,
這也代表其中有6年模型預測跟最終的結果是不一致的,
(1) 2016-2017年的MVP,模型預測得主是Harden(2.73),最終由當年拿下平均大三元
的Westbrook(2.44, 第二)拿走MVP
(2) 2010-2011年,當年分數最高的是LBJ(2.37),最終MVP被Rose(2.23)拿走。
(3) 2004-2005年,也就是上面提到,Nash以史上最低分(1.09)拿下MVP的那年。
當年屈居第二的是Shaq (1.12,其實沒差很多),也難怪他老人家到現在還在記仇
另外,隔年(05-06)Nash連莊時MVP分數也不是第一(1.8),
當年分數第一的是LBJ(2.25),只能說Nash真的是這個模型的outlier
4. Kobe到底有沒有偷了CP3一個MVP?
如果用這個模型看,答案是沒有,當年(07-08)Kobe以2.62分拿下MVP,
屈居第二的CP3分數是2.2分
5. 38年來最大的一二名差距發生在1999-2000年,當年大歐以3.71分拿下MVP,
分數第二的是Alonzo Mourning
作者: artistno1231 (我要飛的更高更遠) 2021-04-30 10:07:00
專業給推!好文可以M起來
作者: william07392 (william55) 2021-04-30 10:07:00
超有趣!
作者: kyoko3678906 2021-04-30 10:11:00
蠻有趣的
作者: KevinJohnson (TSL'7) 2021-04-30 10:17:00
LBJ 要六座MVP 還說沒偷所以NASH最低要說模型嚴重失準嗎
kobe cp3那年最後兩隊對決,賽前就有不少風向是說哪隊西一,mvp機會就大增,最後湖人贏了就這樣
Rose那不算偷吧 組三巨頭戰績反而輸公牛才是關鍵公牛+21勝 聯盟戰績第一 熱火+11勝 聯盟第三
作者: roger2623900 (whitecrow) 2021-04-30 11:24:00
11年這模型算出來也超接近啊 姆斯2.37 Rose2.23 把勝率加權多一點不就是Rose贏了XD 組三巨頭勝率輸公牛還能說被偷喔?
作者: a62103101gun 2021-04-30 18:36:00
完了 雖然喜歡咖喱 看來是阿肥了