圖文影音版 http://www.sportsv.net/articles/6576
這篇主要是介紹美國大聯盟先進媒體 (以下簡稱 MLBAM) 已經發表近一年的新技術:新的
場上追蹤技術,以下簡稱 Statcast。
MLBAM 成立於 2000 年,是大聯盟各隊出資成立的機構,最主要的服務為大家熟知的
MLB.TV,還有興起近十年的新技術,PITCHf/x。PITCHf/x 初期問世時造成棒球界相當大
的震撼,投手投出去的每一顆球都能被加以量化,包括初速、末速、出手點、相對位移、
球體轉速、落球點和球種等數據,過去只有少數球隊擁有的技術如今大剌剌地曝光在所有
球迷面前,不過它並非沒有缺點,一來初期有球種分類的各種歸類技術問題,二來它很難
上手,對於剛入門的球迷朋友是一大挑戰,即便後來這些資料被整理到 GameDay 或某些
特定轉播畫面做呈現,以及某些私人網站幫忙整理了每場球賽產生的數據,但對於初學者
來說想窺其一二還是有很大的困難。
2014 年初,MLBAM 大手筆宣布他們將推出更新一層的技術,Statcast。新的場上追蹤技
術能直接在轉播畫面上呈現各式各樣可以量化的資料,投、打、守和跑等資料一應俱全,
搭配轉播畫面,就算是剛入門的球迷,也能看得很專業。
來看看 Statcast 實際運作的畫面
各種名詞解釋:
Batted ball speed
球被打出去瞬間的速度。
Launch angle
球被打出去瞬間的角度。
Distance
飛行距離
Hang time
飛行時間
Release velocity
球被投出的初速
Effective velocity
我不知道要怎麼翻比較傳神,這邊姑且叫它有效速度,和落球點、反應時間有關,內角高
球對打者來說需要提早出棒,有效速度比較快,反之外角低球的有效速度就比較慢。後期
Statcast 比較常用 perceived velocity 呈現,這個直翻就很好想像,叫做感知速度,
和放球點、內外角以及球距離打者眼睛的遠近有絕對關係。
Spin rate
球的轉速
Extension
投手投球的延展,延展越多 perceived velocity 就越快。
Top speed
跑壘過程中最快瞬間的速度。
Distance
實際跑壘距離。
Shortest
跑壘路程的最短路徑。
Efficiency
=最短路徑/實際跑壘距離。
Lead
跑者”質心”和壘包的距離。
Total distance
實際跑距
First step
啟動時間
Acceleration
加速度
Max speed
最快瞬間速度
Route efficiency
=最短路徑/實際跑距
系統運作原理
Alan Nathan 教授的比喻相當到位,過去都普勒雷達用於追蹤球的軌跡和動態,而影像攝
影傳輸科技應用在追蹤場上的每一個動作細節,兩種科技合在一起就是相當夠力的場上追
蹤技術,Statcast 的運作構想就是這樣。
它的原理很好理解,兩組攝影機陣列,每組各有 3~6 個不等平均分散的攝影器材,安裝
在球場的每個適當角落,就好像人的眼睛或是 3D 逆向掃描系統,你必須有兩個 (組) 可
接收影像的眼睛 (鏡頭),方能判斷視景深淺、建構 3D 影像。
建構出來 3D 影像後,再賦予每個球員、裁判、球一組獨立的 ID 方便系統計算,搭配都
普勒系統追蹤球的軌跡,就形成華麗的 Statcast 系統。Baseballprospectus 網站上的
這篇文章甚至有系統運作圖示,礙於版權煩請自行點閱詳讀。
缺點、抓錯
上述的那篇文章就抓出系統的三大缺點。
第一是球員的追蹤永遠是以質心 (canter of mass) 為基準來運算,白話文就是 “電腦
中” 球員身體的中心點,這造成幾個顯而易見的問題,就是跑者的離壘距離和被 tag
out 時距離壘包的遠近,MLBAM 受訪時承認運用 canter of mass 做運算是因為電腦運算
和判斷的問題,但他們也表示可以搭配影像做判斷修正。後期的 Statcast 影片的呈現方
式就是用高亮度的圓圈顯示距離壘包最近的腳或是身體的某個和壘包最接近的部位,但修
正方式不詳。
第二是影像重疊。當兩個不同 ID 的球員在影像中 “不幸” 重疊時,會造成電腦誤判,
可能 A 球員的數據資料會誤植到 B 球員身上,MLBAM 聲稱他們開發了一套程式解決了這
個問題,正確率可達 80~90 個百分比,當操作者發現電腦最後還是誤植到不對的球員身
上時,可以手動校正錯誤的部分。
第三是資料量實在是太龐大了,每場球會產生 7TB 的資料數據,管理上會是個棘手問題
。
我相信第二、三點是 Statcast 系統沒辦法在比賽中即時呈現的主要原因之一。
下面則是幾個各大論壇最常被提出來討論的問題:
加速度 (Acceleration)。非常令人困惑,我們不清楚它的加速度是某段時間內的平均加
速度或是某個瞬時加速度,到後期 MLBAM 還用了更妙的呈現方式:在 N 秒時達到最大速
度 X。Tango 提出的質問是,假設某球員 6 秒後達到 12.30m/s、7 秒後達到 12.25m/s
,然後 8 秒後達到 12.35m/s,事實上 6~8 秒時都可以算是該球員的最高速度區間,但
系統只會顯示 8 秒後達到最高速度 12.35m/s,而不是 6 秒後達到 12.30m/s,而且球迷
們缺乏比較基準,怎樣的加速度算優於平均?更嚴重的問題是,Statcast 系統似乎很樂
於呈現加速度數據給球迷看,但是很多時候特定的 case 球員們並不會全力衝刺,比方說
準備接殺一顆牆前的高飛球。我們很難理解 Statcast 系統呈現加速度數據的用意是?
另一個問題是 out by “x” seconds。Statcast 系統的邏輯是這樣,假設今天 Todd 起
跑盜向二壘,捕手立刻精準地接傳給進位的二壘手,二壘手早先一步把 Todd tag 出局,
這時 Statcast 系統就會顯示 Todd out by 0.12 seconds,意思是 Todd 先被 tag 到而
0.12 秒後碰觸到二壘壘包。看起來很合理很刺激,是吧?但是今天換成另一種 case,
Todd 準備盜壘,起跑時機很不幸晚了一些,捕手的接傳依舊十分完美,在 Todd 距離二
壘壘包還有兩步的距離,進位的二壘手就接到來自捕手的完美傳球了,二壘手從容不迫地
將 Todd tag 出局,Todd 象徵性地碰了一下二壘壘包就摸摸鼻子走回休息室去了,此時
Statcast 系統會顯示 Todd out by 0.12 seconds、或是其它 0.12 秒左右的秒數,只
看數據看起來似乎又是一次接近刺激的 play,但事實是這樣嗎?
另外,Statcast 系統看起來把防守評估又做得更高級更準確了,但老話一句,棒球防守
一方面是個人能力的展現,另一方面則是團隊合作,我認為,現階段所有人似乎都把守備
評估聚焦在個人能力的估算,後者則完全被忽略,比賽前、比賽中相鄰野手之間的溝通非
常、極度重要,那會影響到防守數據的展現,相鄰野手間彼此個人能力的強弱會有不一樣
的搭配方式,有些選手個人能力特強但溝通能力超爛,我認為這也是防守的一環;另一個
則是防守補位,即便是 MLB 的層級也常發生補位不到位造成失分的案例。人們對於防守
評估,即便是 Statcast 問世,仍有好大一段路要走。
展望未來
我很討厭把巨量資料、大數據這些詞掛在嘴邊,全世界人口那麼多、大腦那麼多顆,每個
人都為了更好的生活品質在做努力,巨量資料、大數據真的沒什麼了不起的,真正要在意
的是,給你 100% 的資料,你能分辨哪些是垃圾訊息或雜訊嗎?就像 Statcast 系統,每
場球會產生 7TB 的資料數據,看起來很屌很酷,但是,真正有用的資訊有多少?有多少
訊息是 MLBAM “刻意製造”的刺激假象?
Statcast 系統肯定會持續精進的,就好像當初 PITCHf/x 剛出來時也是問題一大堆,但
後來修正得還算不錯,MLBAM 最後會在收視率和專業度上取得平衡。
MLBAM 說經過 2014 年實驗性地測試 Statcast 系統的能耐後,2015 年會在每個球場全
面啟動這套系統,有些人說,傳統球探開始要緊張了,Statcast 系統會取代傳統球探成
為新一代的球員評估工具,是真的嗎?我認為不會。球探們最後只是會以另一種型態的身
分存在在棒球界中。Statcast 系統一定會改變棒球生態,但肯定不會是最終章,球員們
跟一般上班族一樣,知道考績和分數怎麼打,就能努力 (作弊??) 爭取更高的層次,屆時
球員們的績效標準要如何評定,思考出發點和現在就會大大不同,人們會進而創造更高層
次的評估工具。