https://reurl.cc/lNVzxj
作者:籃圈即是原點
每天都刷BBE的朋友可能已經發現了,BBE首頁的一體化數據頁面做了一些小調整,主要是
為了應對這賽季EPM的徹底改版。
EPM在這賽季的早些時候上了個全新的版本,這次變化不是簡單的算法優化更新,而是讓E
PM完全變成了另一個數據。過去的單賽季EPM是根據當賽季數據計算的球員賽季表現。根
據作者的意圖,它既是一種面向未來的前瞻性數據,也是一種對當賽季已經完成了的比賽
中球員表現的解釋性或者總結性數據,但是新EPM則是完全的前瞻性數據,提供一種近未
來的球員表現預測。
新EPM的含義和思路基本上和Kostya Medvedovsky創建的DARKO一致。之前我聊過一次幾個
常見一體化數據的對比,當時單獨撇開了DARKO系統中的DPM,就是因為DARKO是思路最特
殊,意圖也完全不同的數據。新EPM和DARKO都采用了機器學習,並且根據球員整個職業生
涯到目前為止的表現,來估算當下這個時間節點下,球員在下一場比賽最有可能打出的表
現,所以他們都是每日滾動更新的。
在DARKO系統中,最核心的其實是對球員面板數據的預測,DPM反倒是個順便產生的數據,
它最初的目的在於回答「當一個球員打出了某種數據,我們該認為這是隨機性帶來的噪音
,還是具有長期意義的水平變化」這個問題。它把球員整個職業生涯的數據都納入計算範
圍,並且給每一項數據設置了一個在0-1之間的參數,並附帶一個和時間軸相關的指數模
型,即越近的比賽在計算中會擁有越高的權重。不同的數據項目會有不同的參數來應對這
項數據本身的穩定性,比如三分命中率遠期數據權重就會比籃下命中率的要高,因為三分
命中率本身的隨機性更大,長期表現更可靠。
DARKP和新EPM通過這種方式把球員的進步或衰退動態地體現在數據中,獲得更好的預測效
果。所以,如果一個球員在新賽季開賽後有一個爆發式的進步,模型在一開始並不會立刻
反映這一點,而是會基於生涯數據對這種進步只給出謹慎地評估,但隨著賽季的進行,球
員持續保持這種水平,近期的比賽數據就會把它視作長期的水平變化反映在預測系統中。
例如Garland在開賽首周後的O-EPM只有+0.8,更接近於他上賽季的表現,兩周後就上升到
了+1.8,現在上升到了+2.8。在舊EPM,LEBRON等xRAPM數據,包括基於面板數據計算的BP
M,PIPM等一體化數據中,我們在賽季初期可能會看到一些很誇張的數值,之後才會因為
樣本增大,數據逐漸趨向穩定(所以他們經常要開賽一兩個月後才公布,BPM的小樣本爆
炸則很容易看到)。
與DARKO的面板數據預測一樣,伴隨新EPM一起上線了Estimated Skills系統,它也給出了
球員面板數據的預測,我個人不玩FBA,不知道DARKO和EPM的這種預測對玩FBA有沒有幫助
,但DARKO的作者聲稱它的系統在FBA遊戲中的預測表現很不粗,至少肯定強於此前市面上
一些網站的表現。
EPM的這次更新對很多pvp玩家來說,價值暴跌,畢竟不再是單賽季的表現綜述了,對線的
時候用起來很不方便,描述本賽季表現得時候並不合適,之前發開賽影響力數據圖得時候
我也用了LEBRON而不是新EPM。不過無論是新EPM還是DARKO本身仍然是非常有價值的,NBA
業內人士有不少也都認可DARKO這種思路,EPM現在也往這個方向上走,或許正說明了這是
一體化數據未來發展的趨勢,所以BBE就借這個機會也把這兩項擺上去方便大家看。比較
遺憾是這類數據的動態變化部分BBE的框架沒法展示。
最近因為更新,可能會連帶出一些bug,有遇到的話可以給我留言或者私信。