[MLB] 介紹xwOBA與延伸探討

作者: Hakase5566 (G8咖哩鳥)   2022-05-29 23:42:33
在各式Statcast數據已經普及的現在,xwOBA堪稱是新一代進階數據裡面最具有代表性的指
標,其特性能把打者所有擊球的品質量化,在傳統的出局/安打或是壘打數的框架中走出一
片以期望值概念為基底的藍海。然而Baseball Savant只考慮擊球初速(EV)和擊球仰角(L
A)的做法,也時常惹來質疑,畢竟兩個相同EV & LA的組合的球,打在左外野和中外野可能
就是全壘打和出局的差別;而xwOBA未考慮推拉角度(Spray Angle),難免有低估極端的推
打者和拉打者之嫌。我們將會透過一系列的文章,探討xwOBA在使用上常見的盲點,或是普
遍被認為是盲點但實際上可以使用的部分。
首先我們要介紹xwOBA的做法,在這之前我們要先搞懂什麼是wOBA,而下圖是wOBA的計算公
式:
https://i.imgur.com/0stg1fg.png
我們可以發現,事實上這一串分母就是打者的有效PA(也扣掉了想打都沒得打的IBB),而
分子則是在這些有效PA下,打者累積的「價值」。這邊可以代入長打率的概念:在長打率的
世界裡面,一支一壘安打的價值是1、二壘安打是2、三壘安打是3,而全壘打是4,這樣的計
分方式雖然非常直觀,但也反映了一種價值觀——那就是一支三壘安打的價值是一壘安打的
三倍、一支全壘打的價值是各一支的三壘安打和一壘安打、四支一壘安打等值於一支全壘打
,但真的可以這樣換算嗎?經常看球的球迷恐怕很難接受這樣的設定。
棒球統計家解決這個困境的作法是去計算每一種產出帶來的價值,如上面的公式所示,一壘
安打是0.89、二壘安打是1.27、全壘打是2.1,而出局是0(接殺和三振都一樣)。可以注意
這裡沒有提到單位,原因是為了讓wOBA更靠近大家習慣的上壘率,這一串係數都是經過調整
的,所以實際上wOBA是沒有單位的,純粹是一個「綜合評估上壘和長打」的指標。所以使用
wOBA的時候,完全可以沿用你對上壘率的感覺——如果你知道一個上壘率高於四成的打者是
上壘機器,那一個wOBA > 0.4的打者同樣是相同等級的進攻機器。
知道了wOBA的意義之後,下一個問題是xwOBA又是什麼?
在上面我們已經知道wOBA是把打者在球場上的產出(二壘安打、全壘打等等)換算成價值,
但這又可以延伸出下一個問題:相同的產出價值就會一樣嗎?擦到球皮的內野安打和打得扎
實的平飛安打都是一壘安打、射牆的飛球和不營養的飛球都會形成二壘安打,還有330和380
英尺的球可能分別形成全壘打和接殺,難道場上發生的結果就能代表打者的強度嗎?顯然是
不行,自從用球棒把球打出去後,打者就已經完成自己的打擊工作,剩下無論是防守者的表
現或是球場風向,都不是打者的能力,因此用wOBA衡量他們的實力恐怕不夠周全。
Baseball Savant想到的做法是還原打者的擊球強度,這的確是聰明的想法,在wOBA或其他
傳統數據的框架底下,打者打了一顆深遠的飛球,本該得到獎勵,卻落得打者時常會因為防
守者的超常發揮還反過來要被扣分。xwOBA直接以EV & LA比對過去所有類似的擊球結果,透
過模型運算(*註1)出各種結果的發生機率,假如一顆95mph & 25度仰角的飛球有10%會出
局、10%會形成一壘安打、40%會形成二壘安打、5%會形成三壘安打、35%會形成全壘打,那
就把它算作0.1支一壘安打、0.4支二壘安打、0.05支三壘安打、0.35支全壘打,透過這種作
法,我們再也不用去討論:「這球本來應該會飛出去,不然至少也是二壘安打,可惜被接殺
」,把打者該得到的價值還給他們,這就是xwOBA的核心理念。而這些形成一壘安打、二壘
安打、…、全壘打的機率,我們就在前面加上一個x,寫作x1B, x2B, …, xHR,並用他們構
築出一個充滿期望值概念的變種wOBA,xwOBA。
這樣的想法非常直覺,但聰明的讀者應該也想到了——只用EV & LA真的沒問題嗎?100mph
& 25度仰角的球打在中外野可能在警戒區被接殺,但95mph & 25度仰角的球打在左外野可能
就飛出去了,不考慮Spray Angle做出來的模型真的能有效量化擊球的強度嗎?下一篇文章
,我們將會討論各類打者的推拉打性質,配合他們xwOBA和wOBA偏離的程度,來探討xwOBA是
否會低估特定類型的打者。
*註1:
根據MLB Technology Blog的解釋,他們在計算各種產出的機率時,結合了兩種數學模型。
針對滾地球、弱擊球、內野小飛球,會使用廣義加法模型。
針對平飛球和飛球,則是使用k-NN模型。關於k-NN模型,最白話的說法就是找到條件最接近
的幾顆球,再去統計他們的結果——例如今天我們要預測一顆90mph & 20度的球形成各種產
出的機率,我們會去找和它最接近(平面座標上距離最短,大家還記得國中數學嗎)的100
顆球,發現其中有20顆出局、50顆一壘安打、20顆二壘安打、10顆三壘安打、0顆全壘打,
那我們就認定這樣的球形成出局、一壘安打、二壘安打、三壘安打、全壘打的比例(定義上
不全然是機率)分別是20%, 50%, 20%, 10%, 0%,再代回一開始的公式就可以知道這顆球的
xwOBA值多少了。
https://reurl.cc/q5Y753
================================
這作者蠻厲害的耶
難得看到有人能把進階數據寫的這麼淺顯易懂
作者: r5588801 (etrava0224)   2022-05-29 23:45:00
棒球進階數據越來越複雜 我都看不懂惹==
作者: phil10048196 (Manstein)   2022-05-29 23:50:00
反正數據僅供參考,實際結果打了才知道,但我滿喜歡看這種介紹進階數據的文章

Links booklink

Contact Us: admin [ a t ] ucptt.com