※ 引述《RollingWave (Lost in the Dark)》之銘言:
: 以上這幾個中 Nash 應該備這種計算法嚴重的低估了,光是兩個MVP 應該就99% 了
: KD 這種年紀就74% 只要不要出現悲劇應該都沒問題的,阿罵這種倒退應該看來是沒機
: 會了。 VC / Pau 這兩個爭議比較大,不過以King 能進,T-Mac 看來也會進的情況下
: 我想他最後也會,Pau 戒指跟聖衣加持機率應該也不錯。
: 在這後面大概最有機會的老人應該無疑是Manu, 他國際加分爆表,光是打爆夢幻隊這點
: 就加分到爆炸了。 以NBA HOF的實際投票法來推測Manu幾乎是100%
看推文一堆批鬥,不過批BR算法之前先來搞清楚一下這東西的基礎。
http://www.basketball-reference.com/about/hof_prob.html
1. 這是一個典型的分類問題,使用一些指標,將樣本來分類,
這邊的類別就是"進名人堂"跟"沒進"兩種,BR使用Logistic Regression,
以過去球員的樣本是否進入名人堂,來評估未來的球員進入名人堂的機率。
2. 他們所使用的預測指標一共有七個,身高、時間指標(可忽略)、
場均得分、籃板、助攻、全明星次數、冠軍次數。
為什麼是這七個,BR沒有解釋,很明顯的可以看出沒有考量國際賽加分之類的,
因為很明顯的是,過去球員根本沒有幾個會有國際賽加分這回事,
這怎麼會有預測力?
但要以這個來批BR的算法是不切實際的,這是整個球員pool在結構性上的改變,
要得到至少在模型內有意義的結果,很難去考慮這種非常細微的因素。
3. 這七個指標的係數分別是:
身高 -0.1771
時間指標 3.1498
場均得分 0.3433
場均籃板 0.4193
場均助攻 0.3327
明星賽次數 0.5626
冠軍次數 0.9151
以Nash跟Bosh為例,兩個人都是八次全明星,得分Bosh勝,
籃板跟助攻兩人數據幾乎是互換,而可以看到助攻其實比較不值錢。
最重要的是熱火這兩連霸下去自然Bosh佔上非常大的優勢。
再者,這裡使用的是場均數據,Nash在生涯末期、Bosh在當打之年,
場均系列的數據Bosh未來只會下修,看看明星賽跟冠軍的累積是否能彌補下去。
而長年得到的累計數據,則沒有被考慮到,原因可能與第4點有關。
推文有人說KD現在就有N%了以後應該也會進,
這是沒有考慮到這個算法可能favor壯年期球員的現實所造成的誤解,
因為這可能會往下降。
4. 傳統上都會覺得有拿MVP就是穩進。那為什麼BR居然沒把MVP次數給放進去?
我的看法是,因為MVP這個指標放進去了,也會被場均數據給"吃掉",
意思是說,拿MVP基本上就是數據好,但是數據好不一定會拿MVP,
而數據好會進名人堂,當把數據好跟MVP這兩件事一起評估下去的時候,
會發現數據好的cover範圍比較大,MVP這個指標有解釋力太小的問題。
5. Nash這兩個MVP其實也是前述結構性上改變的一種體現,翻開NBA的MVP得主清單,
Nash跟Bill Russell就是在比誰得分比較低,而綜合各種場均表現的WS/48來說,
其實也都還算在後段。
第一年拿MVP的時候,其實沒什麼異議,當年太陽62勝聯盟第一,
而MVP幾乎都是投給最佳隊伍的老大;
第二年聯盟有三支60+勝的球隊,而當年在阿罵缺陣的情況下拿下了54勝,
單純從數據上看不出來有什麼改變,但他的價值真正的被凸顯出來。
我認為這是NBA在投MVP票選時一個些微的改變,
導致過去他可能會拿不到第二個MVP,但在現在的體系下他拿到了。
那麼BR沒把MVP當指標放進去是錯的嗎?只要使用過去的資料推測未來這個信條不變,
他就沒什麼道理是錯的,因為你最多也就只能說,
用過去球員是否進名人堂的資料、無法推測現代球員是否會進,
但一旦連過去資料的價值都推翻,那我們還剩下什麼?
感覺、印象、去猜測這個球員會不會進去嗎?
BR這套做法,在結構變動的現今看起來不完美,但應該是best we can do.
與其否定這套估計方式的價值,不如就多等等這個新結構的資料開始累積,
看看"光靠國際賽殺爆夢幻隊就會進"這種斷言是否成真,
然後反過來在修正模型,才是上策。