Why Are Pitchers So Unpredictable?

作者: uranusjr (←這人是超級笨蛋)   2006-09-26 00:44:01
發現實在太多篇了, 重新整理成一篇發一次, 抱歉 orz
===========
本文章除合乎法律之引用 (附上所有作者與出處) 之外, 嚴禁任何形式的
轉錄與引申. 違反者將保留任何法律追訴權.
===========
Baseball Between the Numbers 二章一節
為何投手如此難預測?
Keith Woolner 和 Dayn Perry
1973 年,Tom Seaver 比他前一年多投了 28 局,且將他的 ERA 下降了幾乎整整
一分。他的勝場數掉了兩場。1998 年, Roger Clemens 拿到了美聯賽楊獎。隔
年,他度過了生涯中最糟糕的球季。同樣在 1998 年,Tom Glavine 以二十勝與
2.47 的 ERA 拿到了國聯賽楊獎。1999 年 Glavine 只贏了 14 場比賽,ERA 爆
增至 4.12。還是 1998 年,Randy Johnson 在西雅圖拿到 9-10 與 4.33 ERA 的
成績。在季中被交易到休士頓後,他的成績是 10-1 與 1.28 ERA。
這些有趣的事件全指向一個數據分析家與主流意見共聲贊同的聲明;投球表現難
以預測。事實上,比打擊難多了。
這個現象有兩個原因。首先,成功投球所允許的錯誤範圍較小,投球的動作很要
求體能且會產生耗損。其次,我們用來衡量投球表現的數據具有瑕疵,使投手必
須負擔不在自己影響範圍的因素。
投球的要求
投球動作是很要求細節的運動。看來不起眼的因素可以戲劇性地影響投手的表現,
例如,他踏在投手板上的位置、他把手肘抬到多高、他的手套手在發射動作中如
何移動、他的臀部轉動多少、手指在球上的位置、軸心腳的動作、自由腳落地的
情況、最後的完成動作、和頭部在發射時的穩定性。一張相交相織的精巧網絡,
為了成功投出一球必須完全整齊。
但能丟出不同種類不同速度的各種球路到各個角落,只是挑戰的一部分。投手必
須把這個步驟不斷不斷重複穩定地完成。並且,他在動作中必須不給打者線索、
不使自己受傷、或失去他誘導的能力。連續動作中,任何一個瑕疵都會導致無效
或失敗。著名的洋基投手 Don Larsen 只在使用了不揮臂的姿勢後才獲得成功。
未來名人堂成員 Randy Johnson 直到 Nolan Ryan 幫忙調整一些機制後才能壓制
整個聯盟。傳奇的勇士(現金鶯)投教 Leo Mazzone 以修改投球機制與比賽中的
小幅調整,拯救了數不清的投手生涯。
然而即使允許的失誤如剃刀般細微,高壓投球的姿勢本身就違反自然。這是個破
壞性的動作,對肩膀與手肘的消耗極大。鮮少有投手能在不經大手術的情況下,
擁有長而成功的生涯。即使傷病不會讓投手長期作壁上觀,或者讓他得挨下手術
刀,也仍然會對表現造成影響。煩人的肌腱發炎或所謂的「手臂疲勞」,常常代
表在投手丘上的成效降低 - 雖然隨著時間,投手的手臂可能獲得休息而重新恢
復。由於投球所需的精確性,對方打者攻擊弱球的能力,以及投出棒球所造成的
受傷危險,特定投手未來的路如此難以預測便也不足為奇。
勝敗紀錄
接著,我們使用數據來衡量投手的表現。投手最主要的目標,便是為球隊贏得比
賽。因此對許多球迷而言,衡量先發投手成就的最主要方法便是他的勝敗紀錄。
任何值得尊敬的投手必須勝多於敗,而二十勝球季便是到達「絕佳」的里程碑。
然而贏得比賽有兩個面向:讓自己的球隊得分,及讓你的對手得不了分。理論上,
投手只能影響這個等式的一半,即防止對方得分。但由於防守在阻止得分上佔有
重要的地位,投手事實上只能影響比一半少一些的部份。國家聯盟的投手可能會
得到一兩個打擊機會來幫助得分,但他們通常在打擊上的不適任性只是使隊友的
負擔加重;美國聯盟投手,感謝指定打擊規則,則根本沒得上場打擊。
投手需要來自隊友的得分來幫忙贏得比賽。但每個投手得到的得分支援有相當大
的不同,即使身在同一球隊。舉例而言,Jeremy Bonderman 和 Nate Robertson
2005 年同屬老虎隊。Bonderman 在 29 次先發中投了 189 局,ERA 4.57,Ro-
bertson 則先發 32 場,投 196.7 局,ERA 是略好的 4.48。但他們得到的得分
支援完全不同。Bonderman 得到平均每場 5.67 分的支援,而 Robertson 則平均
每九局只能以 3.66 分的支援掙扎。結果呢?Bonderman 拿到一個正面的 14-13
成績,Robertson 則是比五成低了九場的 7-16。
此外,先發投手的完投次數比起一百年前要少。現今少有投手能在超過百分之二
十的先發中完投。牛棚出發的其他投手會完成他開始的比賽,而球隊勝負的機會
經常取決於中繼投手的運氣。中繼投手可以維持先發投手交來的領先,或敗掉完
成勝場的機會。他們可以拯救在緊張情勢中留下壘上跑者的先發投手,或者讓這
些跑者回來得分,讓已經退場的先發承擔敗戰責任。中繼投手也能在球隊落後時
登場,在場上支撐到己隊成功反擊,或者讓先發投手逃過應得的敗戰。勝敗場數
的給予對球賽中投手本身表現無法影響的因素依賴很重,使得勝敗紀錄與勝率無
法成為投手表現的有效指數。
責任失分率
雖然傳統界仍然過度使用勝敗紀錄,棒球界其實很早就了解到只依賴這項資訊的
問題。為了把投手得到的得分支援影響麻煩去除,人們便創造了責任失分率,以
獨立計算投手本身預防失分的能力。這是個進步。在打擊不佳球隊中的好投手可
能勝敗紀錄很慘,但仍可以拿到很低的 ERA。最著名例子之一發生在 1987 年,
Nolan Ryan 的 ERA 是領先國聯的 2.76,但只拿到 8-16 的成績。
ERA 的紀錄降低了隊友的影響,但並未去除。的確,進攻對投手的影響被消去了,
但牛棚的影響仍然存在,投手可能離開比賽時在壘包上留下跑者。如果接任的中
繼幹得很好讓跑者成為殘壘,先發投手就可逃過一劫而維持他的 ERA。但若中繼
讓他們得分,這些繼承跑者所造成的失分便要算在前任投手身上,即使這並不該
完全怪他。
把所有失分都看得一樣重也有問題 - 一場比賽中,所有的分數並非等值。掉第
十一分比起掉第四分的傷害較小,因為當你已經掉了十分的時候,你大概已經把
比賽輸掉了。然而 ERA 把每個失分都同等對待。十次出場中的一次失常可能會在
投手的 ERA 上產生不適當的影響,即使他在剩下的九次中表現都非常好。九次投
七局掉兩分而一次投三局掉十分的投手,依他的 ERA 會拿到(根據畢氏勝率方程)
.574 的理論勝率,約比他身處平均攻分能力球隊可期待的 .594 勝率,要低了兩
個百分點。一場爆炸所造成的負面影響對他的 ERA 影響過大,對他的整體成績不
利。
中立支援數據
為了處理「分數不等值」問題,Baseball Prospectus 創造了一系列的中立支援
數據。不像一般位置球員,先發投手參與的球賽很少,但在比賽中幾乎完全參與
所有的守備運作。投手的表現是連續面對打者的一個系列,這個打席的結果直接
建立下個打席的狀況。在該時刻,投手對比賽的責任比場上任何其他人都重;對
成功與錯誤的承擔都該反應這項事實。但同時,不論他在這場比賽的表現多好或
者多糟,投手最多也只能製造一勝或一敗。若他失掉二十分,他的 ERA 會像火箭
般升空,但在戰績上紀錄的只會是一敗。
中立支援數據是設計來同時處理這種單場比賽的狀況,以及進攻與牛棚的支援可
能有很大不同,且在先發投手直接控制能力之外的事實。這系列中最基本的成員
是「中立支援勝」(SNW,Support-Neutral Win):給定投手主投的局數、他離
場前失掉的分數、以及當時壘上留下來的跑者,一支具平均攻分及平均牛棚能力
的球隊獲勝機率是多少?「中立支援」這個名字來自於我們移除,或說中和了不
同等級攻分支援和牛棚支援的變因。一支平均程度打擊的球隊可能在先發投手主
投七局無失分的狀況擁有八成五的勝率,那麼這個狀況就值 0.85 SNW。「中立支
援敗」(SNL,Support-Neutral Loss)就是相反 - 一支平均球隊在先發投手完
成一定狀況後輸球的機率。剛剛七局無失分的紀錄就等於 0.15 SNL。隨著球季的
進行,投手的「中立支援勝負」(SNWL,Support-Neutral Win-Loss)紀錄便是
每場先發 SNW 與 SNL 的總和。這可以得到投手表現好壞的更好指標,不受進攻
與牛棚支援的影響。投手在比賽中投得越長,失分越少,他能拿到的 SNW 就會越
高。
「中立支援價值和」(SNVA,Support-Neutral Value Added)衡量投手的表現比
平均(.500)高多少。在我們的單場 0.85 SNW 例子裡,投手的 SNVA 是 0.85 -
0.50 = 0.35 SNVA。也有其他,例如不比較投手和平均的差距,而比較和取代水
平(replacement level)的差距,或者依對手打擊強度調整概率的延伸。在中立
支援數據系列中,最容易理解的數據是「中立支援打線調整取代水平差價值和」
(SNLVAR,Support-Neutral Lineup-agjusted Value Added Above Replacement
Level)。2005 年,Roger Clemens 擁有領先全聯盟的 9.4 SNLVAR,意指他比一
個邊緣的取代水平投手,在面對相同打者狀況下,可以幫一支平均水準球隊多拿
下 9.4 場勝利。(更多有關取代水平的討論見五章一節。)
再談 ERA
咱們回到責任失分率和它背後的另一個目標。ERA 嘗試將投手的表現從他身後的
野手中獨立出來,只在先發投手有「責任」時才把失分算在他身上 - 亦即,分
數並非由野手的失誤造成。雖然立意甚佳,責任與非責任失分的概念卻有問題。
失誤率在過去幾十年內已大幅下降,而守備率則來到或近於歷年最高。現代比賽
中野手守備差距更多來自於範圍與站位的差別,而非是否容易失誤。Andruw Jones
能簡單移動接殺的飛球對 Bernie Williams 來說會落在無人地帶,輕鬆形成二壘
安打。失誤和守備率無法合適地掌握投手身後守備員的不同品質。因此,用失誤
來區分失分責任屬於投手或野手並不值得信賴。
失分率
失分率(RA,Run Average)常被用來取代 ERA,以去除責任與非責任失分間歧異
所造成的誤導。這看來像是更退一步,甚至不試著區分投手與野手的表現。然而,
我們若了解被測量的是整個防守的效率(投球加守備),這就更合理了。預防失
分就是預防失分,分數的責任誰屬並不影響球隊的勝負。如我們將看到的,分離
投手與野手表現,有比使用不完全且扭曲如 ERA 的數據更好的方案。
ERA 和 RA 都有關於連續打擊事件上的問題。當安打與保送連續發生時,分數進
帳會多於它們分散於球賽各時刻的狀況。這是因為,除了全壘打之外,進攻球隊
需要一系列的成功打擊才能把分數送回本壘板。兩位被安打數、長打、總保送數
皆相同的投手可能失掉不同的分數,因為安打與保送的分佈狀況不同。但那基本
上是隨機的,因為投手在被安打或投出保送時,自己並不存在顯著的控制能力。
週邊 ERA
為了突破密集安打的問題,我們可以使用投手的「週邊數據」 - 他被安打、投
出保送、三振、與全壘打的基礎比率 - 來組合成一個「期望」的 ERA 或 RA。
這被稱作「週邊 ERA」(PERA,Peripheral ERA)。(傳統在這個名稱上使用 ERA
而不是 RA,雖然兩個版本的概念都一樣適用。)本質上,PERA 便將投手紀錄中
密集安打的成份調整符合平均。被打出不尋常密集安打的投手在被檢視週邊數據
時,高度密集產生的狀況會降低,而投手若被安打與保送分散,他的 PERA 則會
提供更標準的密集狀況檢視。
PERA 將投手的週邊比率合成一個一般球迷可辨認及解讀的數字 - 他應得的 ERA。
PERA 只使用投手的被安打率、保送率、全壘打率、以及三振率,是在預測未來球
季上比 ERA 更好的工具。它是對投手表現好壞的更真實反應。在計算 PERA 時,
其中一個比率便是投手的被安打率。但除了全壘打外的安打,都是由打進場內的
球所形成。守備這些球的工作幾乎總是落在其他野手的身上,而因此隊友守備的
表現也會反應在投手的被安打率上。我們稍早曾經碰過這個議題,並駁回了責任
失分的概念,因為那並沒有辦法適當地紀錄隊友守備範圍地影響。即使是投手的
週邊數據,尤其被安打率,也不真正是投手表現的真實指標。
防守獨立投球數據
那麼要怎麼把投球和守備分離呢?對被打入場內的球而言,整個流程包括球被投
手投出,離開打者的球棒,以及進入野手的手套。這一系列的連續動作過程不過
數秒,也不像局與局、打席與打席、甚至球與球之間之間那樣,動作有所間斷。
多年來,將投球與守備之間的關聯區分顯得不可能,直到 Voros McCraken 在兩
千年初提出一個革命性的理論,使棒球分析界吹起一股風暴。
McCracken 表明,打者打入場內的球,與投球的投手之間幾乎沒有關聯。測量場
內球形成安打的頻率,即稱作「場內球打擊率」(BABIP,batting average on
balls in play)的數據,便將投手與守備員作為一個整體,顯示他們承擔基本守
備責任,即將場內球轉為出局數的能力。比較同隊,因此與相同的守備隊員搭配
的投手,便有可能估計投手對 BABIP 有多少影響力,而又有多少是守備的責任。
結論令人震驚。投手的素質與他的 BABIP 似乎毫無關聯。聯盟中最好與最差的
投手都可能有很高的 BABIP。舉例來說,2005 年,經常是賽楊熱門人選的 Roy
Oswalt 擁有 .310 BABIP。魔鬼魚隊平凡的 Doug Waechter 則是 .308。全壘打
製造機 Eric Milton 是 .317,而一線先發 John Lackey 則拿到了 .328。二流
投手 Scott Elarton 的 BABIP 是 .274,而正嶄露頭角的新星 Jake Peavy 則
是 .281。
並且,這還不是一年的偶然。好與壞投手在每年的 BABIP 排行榜上,常分散在
清單裡頭。此外,投手在各時間的排名高低完全沒有穩定性。同一位投手可能
一年在名單頂端,隔年則在墊底附近。同樣的投手可能看著他們的 BABIP 逐年
產生嚇人的震盪。McCracken 得出的必然結論即是,投手對被打進場內的球形
成安打或出局的控制能力令人驚訝地小 - 事實上,小到幾乎可以在初步估計
中忽略。如果球被打進場內,則發生的狀況幾乎完全取決於野手,而非投手。
雖然球隊的守備相較之下在球季間較為穩定,對單獨投手的防守支援則會瘋狂
且隨機變化,造成投手 BABIP 的混亂結果。
要說這個結果與直覺相違,或者難以相信,都是太保守的說法。面對 Pedro
Martinez 所打出的球和面對 Jose Lima 時幾乎毫無差別(除了打過大牆的那
些)?在 McCracken 將他的結果向一些媒體,包括 Baseball Prospectus 網
站提出後,他的結論被詳細地全盤檢查,並主要被同意。不幸的是,他發現大
眾化的版本成了「投手無法影響被擊入場內的球」。雖然這在表達上很簡明,
卻不完全正確 - 這個陳述在棒球新聞界關注 Michael Lewis 的 Moneyball
同時,擦出一道不必要的火光。不管曲解與危言聳聽,這結果的本質 - 投手
對 BABIP 影響力非常小,而比起逐年守備的差異性,這個影響重要性不高 -
已被證明正確,且被分析界普遍接受。現在甚至在主流如 ESPN 的網站上,都
能看到 BABIP。
一個新的投球測量法,也從這個研究中起頭。防守獨立投球數據(DIPS,de-
fensive-independent pitching statistics)是將守備員影響從投手表現中移
除的更進一步。消除所有一般包含其他守備員的結果,非三振的出局數、以及
非全壘打的安打,我們便只剩下三振、保送(包含觸身球)、以及全壘打。與
週邊 ERA 類似,DIPS ERA 在只給定三振、保送、和被全壘打率的狀況下,估
計投手在身後有平均防守時該有的 ERA。但 DIPS ERA 比 PERA 更「純」,因
它更從計算法中消去了 BABIP 所造成的隨機性。(更多有關 DIPS 的討論見三
章一節。)
成份性的投球比率
當然 DIPS ERA 本身就是更基本成份:三振率、保送率、和被全壘打率的合成了。
在投手擁有最大影響力的結果上,這三項比率可視為投手表現的基準。這是投手,
以及他在比賽中能不受野手、攻擊支援、與密集安打等影響而控制之能力的最純
正樣貌。
但其實,我們還沒真正結束 - 還能再做一個小小的改進。投手的被全壘打率中
也有一些外部因素。投手似乎可以控制球被打到地上或空中。但球會被打多遠,
或者會直擊大牆還是場內落地,就取決於其他因素了。具優勢的天氣和風的狀況、
球場的形狀、打擊者的力量、以及其他因素使被全壘打率會在年與年之間變動,
而不如直接看投手的整體滾地球與飛球傾向。這個面向與我們已經看過的數據不
同的地方在於,它並不反應球場上的真實事件 - 出局、安打、保送、和勝利 -
而是與這些事件中某些相關的一個特點或性質。滾地一壘安打與飛球一壘安打沒
什麼不同。犧牲高飛與二壘滾地所造成的得分也價值相等。但在了解投手表現好
壞方面,這是一個有用的差異,所以讓我們用滾地球比例來取代被全壘打率。
這三個成份數據 - 三振率、保送率、以及滾地球比例 - 反應了投手工作中基
本的重要能力:找到好球帶的能力、讓打者打不到球、以及把打者打到的球留在
地面上。在這個層級,這些數字都與投手隊友們的進攻與防守表現獨立 - 投手
必須負擔全部的責任。它們也是年與年之間最可靠且穩定的投球數據:事實上,
這些成份數據和打擊數據一樣可靠。
投球數據的可靠性
對投球表現的傳統測量無法提供準確的描述。投手可能交出與前季同等質量的表
現,但若身後的守備員變差、無法得到同等的進攻支援、或只是被打安打的時機
不佳,這些傳統數字就會看起來不同。你必須看得更深,才能發現投手並未改變。
其實,變的是環境。
描繪這一點的另一個方法是看看年與年間不同投球數據的穩定性。說得更清楚點,
我們可以看看某年與下一年同樣數據值的相關性。相關性的範圍是從 -1 到 +1。
數值越靠近 +1,則該數據在年與年之間就更具穩定性與可預測性。接近零的相關
性顯示年與年之間並沒有一致性。接近 -1 的相關性則顯示該數值會跳動 - 某
年的高值暗示隔年會有低值。表 2.1 觀察從 1972 至 2004 之間所有在連續兩年
面對 500 人次以上打者,並計算我們本章討論的不同投球數據在年與年之間的相
關性。
表 2-1.1 投球數據的年與年相關性
================================
年與年
數據 相關性

Links booklink

Contact Us: admin [ a t ] ucptt.com