大家好,我也是潛水已久的鄉民啦。
剛好對棒球有一些接觸,打過一點球,做過幾次國家隊情蒐(大家可以到運動視界看看我
的分享,壓制後來在大聯盟兩年WRC+都超過116的Jake Cronenworth就是爽啦)
看到我們的合夥人littleshin出來發文,當然是要相挺一下。很高興大家對電子好球帶和
數
個沒有走錯。
看takuro1026說的一點錯都沒有,台灣真的是不缺人才。我們的努力就是要突破這個大家
認為的限制,好不容易找到資金和團隊組織起來。可以說台灣的鷹眼系統真的不是夢想了
,已經是一個持續在優化的現在進行式了。現在不只有棒球情蒐方面的專業,團隊裡也有
數據處理、機器學習、影像辨識、影像串流、美術設計、軟體網站開發的專長了。剛好趁
這個機會和大家分享一下了。
不過首先,因為顧及球隊對戰資訊,我們無法公開數據的選手姓名。而場次也是亂數抽樣
的出來,不是一整季的成績。另外,電子好球帶不可能是百分之百的精準,不過我可以說
有littleshin在維護,我們應該是有相當程度的準確。
那接下來就進入正題啦~
裁判:
裁判的議題一直是大家很熱烈討論的重點
原本其實我們都會有好像裁判都撿太小的感覺,但是若是如下圖依照美國statscast系統
的好球帶設定,樣本裡中職裁判的準確度是86%。
(準確度的定義 Zone內判好球+O-Zone判壞球的比例)
https://i.imgur.com/48PISnW.jpg
其實實務上,看美國設定好球帶下緣是18英吋是有一點低,應該是為了剛好滿足1.5-3.5
英尺的數字,那往往都在膝蓋下緣。照台灣通常都是撿提高一顆球的高度的話,以20英吋
做下緣,準確率就會提高到89%。
不過不同的主審的確會有相當明顯不一樣的好球帶。
這邊跟大家分享兩個不同的主審的幾場比賽的好球帶,把好球帶下緣提高到20英吋,很明
顯還是有各自主審的主觀因素在。
https://i.imgur.com/mut2RCw.png
(綠色:Zone內判好球 白色:Zone內判壞球 黃色:O-Zone判好球)
偷好球:
再來我們來講講捕手的Framing。我們把邊邊角角的球分成不能區域看被接成好球的機率
有多少。為了跟美國的數據保持一致,我們維持好球帶下緣18英吋的設定,也因此反而中
職捕手在好球帶靠把手套往上接的部分也還是難以偷到好球,反而是外角接得好的會明顯
有接捕優勢。
https://i.imgur.com/D7a76bm.gif
這GIF是一顆進壘點21英吋高的球 被接成壞球
以這個前提來看,中職Framing 最好的捕手跟最差的捕手 在邊角的球接成的好球率的差
距卻其實非常大。大家應該可以猜的到,黃色球衣的捕手有一個接球很順暢的邊角球接成
好球的比例有到60.5%,而最差的捕手則是不到40%。其中有一隊比較明顯的平均Framing
的能力就較差一點了。
https://i.imgur.com/zJWK2OO.jpg
接下來講一講進階數據
現在美國都比較多以擊球類別來看,也就是分成
Barrel (完全擊中球心,約為擊球初速98+擊球仰角26-31)
Solid (強擊球)
Burner and Flare (強勁平飛和小飛球)
Top (擊中上緣,幾乎都是滾地)
Under (擊中下緣,幾乎都是飛球)
Weak (弱擊球)
這邊是一張在樣本內,某隊的擊球型態
https://i.imgur.com/Eyx0VZ0.jpg
大聯盟的Barrel比例大概是6-7%,在強勁的擊球部分中華職棒是還有成長空間的。雖然這
也有可能是小樣本的關係,不過看完後其實覺得可能這些數值可能都要針對台灣的環境再
做修正。
我們都知道 Barrel基本上就是全壘打,但之前一直不知的是其實Burner and Flare的打
擊率是次高的,在大聯盟的統計大概是0.659。因此我也好奇台灣同類型的擊球打擊率會
是多少。結果發現中職的Burner and Flare也是打擊率第二高的,而且高達0.752。這可
能跟守備範圍和布陣的攔截有一些關係。
擊球強度的數據在長期統計下來,也可以當作是用球彈性係數改變的參考,可能可以追蹤
選手的成長或老化,甚至透過篩選季節時間也可以做為探究球場因素的參數。
當然,最基本就是用這些數據來評估一個選手的型態。下面這張圖就是中職一個有名的腿
哥五次先發的擊出球。
https://i.imgur.com/j16DADZ.jpg
這邊可以看到他這12個擊出球裡面沒有一球擊球初速達到 HardHit (擊球初速超過98 英
里) 而SweetSpot% (擊球仰角8-32度)的比例也遠低於平均值。
中職的Hardhit%約在24%,而大聯盟約在38.8%,中職的SweetSpot%平均值大約在40%左右
,而大聯盟約在33%。
球場因素:
我們另外可以來看中華職棒的球場因素,不過因為只計算今年度,各球場的場次並不算多
,容易受到極端值影響。這邊還是可以比較明顯感受出桃園球場是比較偏向打者的球場。
https://i.imgur.com/4Qd00tA.png
場地因素不只可以看得分,也可以看全壘打或是二、三壘安打數等等。也許剛剛那個腿哥
就適合在二三壘安打係數較高的球場出賽。
這一個數據的用處在,有了長期下來穩定的場地因素係數,我們可以把不同球隊的選手放
在一個公平的基準上,去看假設依照所有球場聯盟的平均值,這些選手會打出什麼樣的成
績。這本身可以做出一個較公平的成績預測,也方便做選手估值的討論。
Pitch Value:
我們覺得有一個數據- Pitch Value,也是非常重要。他基本上就是根據長期數據的平均
得失分,給每個情境、球數狀況等等給上一個分數價值,例如0好0壞時投一個好球的價值
就是0.125分。因為我們累積的數據並不足,還沒辦法計算屬於中華職棒的Pitch Value,
我們暫時先套用大聯盟的Pitch Value數值。今年度本土左投表現都不太好,我就列出其
中一個左投手各球種每100球的價值 (Runs above average per 100 pitch)。(這裡正負
顛倒,所以省下越多分的球種,價值會是較高的正數,反之被打得較慘的就會是較高的負
分)
wFA/C (直球): 0.3256
wSI/C(滑球): -0.694
wCU/C(曲球): 0.111
wCH/C(變速): -0.017
透過像是Pitch Value這一類的數據處理,我們不只可以得到投手球路的數據評價,也可
以去計算很多不同情境下換算成得分數的價值貢獻。下面這邊再舉幾個例子:
壘上有人的得分預期值
捕手的接球幫球隊省下的分數
主審判決對比賽的影響
投手在關鍵時刻的表現
得到這些數值後,又可以進而去做戰術的考量。例如依照不同壘上的得分預期值(或是得
分機率)去決定是否適合做觸擊或是盜壘的選擇,或是依照裁判的判決喜好去搭配更能把
特定位置接捕成好球的捕手等等。
數據裡有無限的可能,可以不斷的做沙盤推演。一個好的投手,也許對球隊有著上千萬的
價值,但是我們也許可以開玩笑的說,如果真的用Run Value來計算,搞不好一套情蒐系
統一年能幫球隊省下的分數可能還更多呢XDD。
我們的系統不只可以搭配自主開發的電子好球帶和鷹眼系統,另外其實也和Trackman數據
是相容的,是可以直接倒進資料庫跑出分析的。所以我們也能拿有前幾年資料的球團手上
的進階數據,直接重建過去的分析。
此外,我們的系統也不只是服務職業球隊的。為了把逐球紀錄和比賽成績整合在同一個系
統紀錄,我們已經費盡心思開發一套IPad記錄系統。
這麼大費周章的原因就是因為有太多特殊狀況的時候,逐球紀錄是沒辦法直接做成績的歸
屬。比如說高飛犧牲打如果外野手接球失誤,他還是算是一隻犧飛,打者不記打數。或者
說打席間如果已經兩好球了,換打者代打被三振,打席成績歸屬是屬於前一位被換掉的打
者。為此,我們的工程師可是沒有停歇地加倍工期呢(只有我是最頭暈的…..) 況且還有
守備成績,跑壘成績等之後搭配鷹眼時會使用到的。比如說,把跑者離壘距離和起跑速度
和盜壘的成績對應起來,或是外野手的位置移動。
在過去的一年裡,我們已經從現在大家在電視上看得到的基礎大幅往前跨進一步了。而且
更好的消息是,未來這個紀錄APP是打算直接開放給大眾下載使用,所以不管是職棒比賽
還是學校的系隊比賽,之後都可以透過自己紀錄上傳到雲端做分析跑出屬於自己棒球生涯
獨一無二的數據分析。未來大家上PTT筆戰的時候,吵起架來都可以是有憑有據。
https://i.imgur.com/xAdBQnq.jpg
我想我們能做的還有很多,包括把學生比賽數據電子化做長期追蹤,又或者把國家隊情蒐
組常設化、從小追蹤國外重點選手,甚至是一般業餘比賽包含假日組、學生組紀錄電子化
,或者是和學校單位合作做棒球數據研究等等。我們一直堅信,我們做的事情是可以幫助
台灣棒球的,尤其現在就是這個轉型的時間點。這種事等別人來做,不如就直接自己動手
做吧。
夢想總是很大,就看看接下來有什麼樣的機運發展啦,也歡迎有興趣的人來和我們聯絡。
很高興大家都對這個議題有興趣,每次看到有關數據的討論,心中都會燃起一把火。在沒
有體育署、科技部等大型計畫的補助下,我們還能走到這一步。我自己絕對是一個棒球傻
子,從我建築師不當決定跑去挑戰職棒開始,棒球…就是一條不歸路啦…..也還好還有一
群一樣是棒球傻子的人陪我一起才能走到現在。
如果大家真的很有興趣的話,那我們會來開個粉絲專頁,定期跟大家分享一些進階的棒球
數據,希望明年球季時就能和大家見面了。
直到那之前,我們就下次見啦。