老一派的觀點很注重投手身材,以前我也認為身材好是否球威較強也比較不容易受傷
這篇文用回歸去驗證出結論,雖是很久前的文,但內容很不錯
我按照意思解釋,沒逐字翻譯,一小部分段落也稍微調整成我認為語意較順的順序
http://sabr.org/research/does-pitcher-s-height-matter
1993年LAD把一個Setup Man拿去給博覽會換很好的二壘手,該投手雖然有強力的手臂
但根據Tommy Lasorda,該投手太矮,身材條件有限,沒有足夠的體力先發,故潛力有限
這位被交易出去的投手就是Pedro
另外,在NYY提供比LAD更多的簽約金後,Whitey Ford與NYY簽約,LAD當時告訴Whitey Ford
"你的身材太矮"
高的投手被人為球威較猛,球下沉尾勁較強,投球釋放點離本壘板較近,身材好也比較能負
擔投球的負荷
首先,作者先從大聯盟投手作為樣本,將1990~2007的SP(至少局數符合爭ERA王)與RP
(最少出賽45場),罷工那年則依比例將局數與出賽數作調整
表1 1990–2007大聯盟先發投手
Dependent Variable Linear Regression P-Value Sign of the Effect
R-Squared of Data (If there is one)
BB/9 .0001 .82 N/A
ERA .00001 .94 N/A
HR/ 9 .003 .29 N/A
K/9 .005 .14 N/A
K/BB .0006 .61 N/A
WHIP .0003 .73 N/A
如同上表1. 資料顯示先發投手身高與幾個衡量投手的指標是沒有關聯性的,各項指標中
r-square最高是K/9, 只有0.005,數值極低,代表投手身高與K/9關聯性極低,
而P Value都很高,最低也有0.14,意味統計是顯著的
備註: P value : 無單位的通用指標,用來衡量某個假說的顯著性,P Value的比較對象
是顯著水準(significance level)
表2 1990–2007大聯盟後援投手
Dependent Variable Linear Regression P-Value Sign of the Effect
R-Squared of Data (If there is one)
BB/9 .0007 .48 N/A
ERA .0026 .19 N/A
HR/ 9 .0008 .46 N/A
K/9 .003 .13 N/A
K/BB .00003 .89 N/A
WHIP .001 .42 N/A
表2. 資料顯示後援投手身高與幾個衡量投手的指標也沒有關聯性,各項指標中
r-square最高是K/9, 只有0.03,數值依舊不高,而P Value都很高,遠高於0.05
故從上面資料來看,無論先發與後援,已經上大聯盟的投手,成績與身高沒有關連性,
然而對小聯盟投手來說呢?各隊都要找能夠成為大聯盟投手的潛力新秀,如果高的新秀投手
比較好,球探自然會關注高的投手,許多人相信身高高的投手比較有未來性,球速會
隨著養成增長,如2002第7輪的 Joel Zumaya,當時球速只有upper 80s,會在7輪被選
就是因為他的身材比較projectable(找不到選秀時期身高,只找到現在的6-3 215),
照這樣的觀點來論新秀,不管SP或RP都應該選身高高的,這樣上大聯盟的機率才高
於是作者用回歸與chi-square tests確認投手身高與成績是否有關連,樣本是所有參加
選秀的投手(因為沒被選秀會選上的投手就沒辦法採入,畢竟資訊不足,故如果將樣本數
擴大到所有包含沒被選秀的投手,或許答案會不一樣)
表3 規則4選秀 1985-2002
Dependent Variable P-Value of Sign of the Effect
Chi-Square Test (If there is one)
Round drafted 0 Positive備註1
達到最高層級(MLB,AAA,etc) .21 N/A
成為大聯盟投手 .61 N/A
成為大聯盟SP .005 Positive備註2
成為大聯盟RP .52 N/A
從表3中得知,身高與上大聯盟的可能性是無關的,但是身高越高,選秀越早被選走(備註1)
越高越容易成為大聯盟先發投手(備註2)
然而這樣下結論可能太武斷, Brad Steil,MIN director of baseball operations,提到
或許因為對投手身高有先入為主個概念,造成球團給身高高的投手比較多先發的機會
如果矮投手跟高投手一樣在爬小聯盟升上大聯盟,甚至解決大聯盟打者的能力是一樣的,
那麼矮投手與高投手與投球績效確實是沒有關聯的,如同上述BB/9,K/9,投球局數,ERA等
已驗證是沒有關聯的,然而需要驗證的還有一點,進DL的比率是否一樣,如果這點也證實
沒有關聯,那麼便可以下結論,身高高的投手成為SP比較多單純只是被給予較多的機會,
而非身高造成的結果
另一個矮投手比較後段被選的原因就是高投手比矮投手更耐投,David Cameron
在BP寫的文章“There is validity to the belief that shorter pitchers
have a smaller marginfor error."
矮投為了投出跟高投一樣的球威,會更用力投球,造成更差的投球機制,進而造成受傷
首先,對於SP,矮投是否能投跟高投一樣的局數
對於RP,矮投是否能投跟高投一樣的局數與一樣的出賽頻率
表 4(上). Durability Data SP&RP, 1990–2007
Dependent Variable R-Squared P-Value of Data Sign of the Effect
(If there is one)
投球局數 (SP) .003 .31 N/A
投球局數 (RP) .003 .19 N/A
出賽數 (RP) .0016 .30 N/A
表4(上)得知,R-Squared未超過0.003, P-Value遠遠高於0.05,並沒有證明身高與單一
球季中是否比較耐投的關聯性
再來經過一年又一年的投球以後,高投是否比較不容易受傷?作者用投球局數是否有
爭ERA王資格的球季數與RP是否出賽超過45場
表 4(下). Durability Data SP&RP, 1990–2007
Dependent Variable P-Value of Chi-Square Test Sign of the Effect
(If there is one)
局數是否有爭ERA王資格的球季數 .98 N/A
出賽超過45場球季數 .45 N/A
P-Value分別是極高的0.98與.045,這表示顯示身高與在大聯盟投球的耐投度
有關連的可能性跟瑞士發動第三次世界大戰的機率是一樣的
除了投球局數外,再來看看1994~2007年間進DL的頻率
表5. DL, 1994–2007
Dependent Variable P-Value of Sign of the Effect
Chi-Square Test (If there is
one)
進DL .63 N/A
因持續性傷痛進DL .27 N/A
有嚴重手傷前肇進DL .36 N/A
嚴重手上進DL .82 N/A
Dependent Variable R-Squared P-Value of Data Sign of the Effect
(If there is one)
出賽數 .006 .0018 Negative*
先發次數 .002 .096 N/A
投球局數 .00001 .88 N/A
* 越高投手出賽數越少
R-Squared最高0.002, P Value最低也有0.096,顯示身高與耐投沒有關係,
然而身高與出賽數是有關連的,負相關,越高出賽數越低
Dr. Robert Altbaum of Westport, Connecticut將可能進DL的傷勢歸類為8種
1. non-baseball injuries
2. injuries that are unlikely to be related to a pitcher’s height
3. nagging pitching injuries
4. serious injuries to body parts other than the arm
5. precursors to arm injuries
6. serious arm injuries
7. minor injuries
8. injuries that are unable to be determined.
與身高不相關的傷痛為起水泡與傳染病
Nagging injuries指的是手臂以外的小傷如鼠蹊部拉傷與膝蓋腱炎
以下三種是矮投手一般認為比較容易造成的傷痛:
precursors to arm injuries是指手肘拉傷與旋轉肌腱炎,雖然本身不嚴重,
但可能導致嚴重手臂傷勢
嚴重手臂傷勢是指韌帶撕裂傷或旋轉肌撕裂傷-造成投手法繼續投球甚至威脅
投手生涯,需要手術的傷
P Value沒有低於0.05,說明沒有證據證明身高與下列5種進DL傷勢有關
1. 進DL次數
2. 待DL天數
3. 因持續性的傷痛進DL
4. 因嚴重傷痛進DL
5. 因出現嚴重傷痛前兆而進DL
故資料證明,統計上,沒有證據顯示身高與投手耐不耐投的關聯性,高投矮投
有一樣可能性進DL,復原一樣快,受傷的頻率一樣
再來把左投與右投拆開來分析會是如何?
表 6. Established MLB RHSP versus Established MLB LHSP, 1990–2007
Dependent Variable R-Squared P-Value of Data Sign of the Effect
(If there is one)
Right, Left Right, Left Right, Left
BB/9 .002, .007 .47, .38 N/A, N/A
ERA .001, .013 .56, .22 N/A, N/A
HR/9 .002, .006 .44, .43 N/A, N/A
K/9 .0001,.007 .27, .39 N/A, N/A
K/BB .0002,.004 .82, .52 N/A, N/A
WHIP .0001,.01 .84, .28 N/A, N/A
表 7. Established MLB RHRP versus Established MLB LHRP, 1990–2007
Dependent Variable R-Squared P-Value of Data Sign of the Effect
(If there is one)
Right, Left Right, Left Right, Left
BB/9 .001, .0111 .49, .15 N/A, N/A
ERA .0016,.0195 .38, .02 N/A, Positive*
HR/9 2.64e-6,.0069 .97, .25 N/A, N/A
K/9 .0012,.0144 .45, .10 N/A, N/A
K/BB .0003,.00005 .68, .92 N/A, N/A
WHIP .0019,.0074 .34, .24 N/A, N/A
*The taller the higher the ERA
表8 RHP VS LHP 規則4選秀 1985-2002
Dependent Variable P-Value of Sign of the Effect
Chi-Square Test (If there is one)
Right, Left Right, Left
Round drafted 1.48e-12,4.07e-7 Positive, *
Positive*
達到最高層級(MLB,AAA,etc) .22, not enough data N/A, not enough
data
成為大聯盟投手 .43, .81 N/A, N/A
成為大聯盟SP .006, .45 Positive**, N/A
成為大聯盟RP .80, .45 N/A, N/A
* 越高選秀越早被選
** 越高越可能站穩大聯盟先發
表9.RHP VS LHP DL, 1994–2007
Dependent Variable P-Value of Sign of the Effect
Chi-Square Test (If there is one)
Right Left Right Left
進DL .11, not enough data N/A, not enough
data
因持續性傷痛進DL .14, not enough data N/A, not enough
data
有嚴重手傷前肇進DL .29, not enough data N/A, not enough
data
嚴重手上進DL .78, not enough data N/A, not enough
data
進DL天數 .71, .43 N/A, N/A
Dependent Variable R-Squared P-Value of Data Sign of the Effect
(If there is one)
Right Left Right Left Right Left
出賽數 .009, .003 .0013 .24 Negative*, N/A
先發次數 .00004,.005 .49, .12 N/A , N/A
投球局數 .00009,.003 .31, .27 N/A , N/A
BB/9 .001, .0111 .49, .15 N/A , N/A
* 越高出賽數越少
表10.RHP SP&RP VS LHP SP&RP Durability Data, 1990–2007
Dependent Variable R-Squared P-Value of Data Sign of the Effect
(If there is one)
Right Left Right Left Right Left
投球局數(SP) .0002, .033 .81, .05 N/A,
Positive*
投球局數(RP) .0006, .0044 .60, .36 N/A, N/A
出賽數(RP) .0019, .0018 .33, .56 N/A, N/A
* 越高出賽數越少
Dependent Variable P-Value of Sign of the Effect
Chi-Square Test (If there is one)
Right Left Right Left
局數夠爭ERA王球季數 not enough data not enough data not enough data not
enough data
出賽數超過45場球季數 not enough data not enough data not enough data not
enough data
從表6~10可以知道,之前的結論: 身高與投手成績並無關聯,不會因為左右投而影響,
RHP最高的R-Squared只有.009,意味只有0.9%證明身高與投球成績有影響之假設
LHP最高的R-Squared只有.033,意味只有3.3%證明身高與投球成績有影響之假設
p-value低於0.05的只有左手RP的ERA(表7),RHP的出賽數(表9)以及左手SP
的單季投球局數(表10)
對於這些關聯並無合理的解釋,表7顯示身高越高的左手RP,ERA越高,與一般認知相反
表9身高越高的右投手,出賽數越少
而表10中顯示身高越高的左手SP,投球局數越多,什麼原因造成這個結果是很可疑的
這統計中,右手SP的身高與投球局數是沒有關聯的,矮左SP投球局數卻比高左SP少,
真是矮投不耐投?或是單純球隊經理與主管認為如此,而給比較少的機會?
或許矮小SP比較不耐投,然而其差異性就統計上依舊不明顯
(後三行不是很了解,應該翻錯,待更正)
後面Appendix是作者如何做統計的細節,太枯燥就不翻了
另外,關於文中兩點,個人的看法
1.身高與出賽數是有關連的,負相關,越高出賽數越低(位於表5)
2.身高越高的右投手,出賽數越少 (位於表9)
個人認為應該是因球隊老觀念,給矮投較少當SP的機會,所以矮投成為RP比率較高,出賽數
肯定RP比SP多,才造成身高越高的投手出賽數越低?
而為何左投手無身高越高,出賽數越少情形?或許本身左投就稀有,競爭不像右投那麼激烈,
故不管高矮,只要左投有站SP潛力,球隊會給比較多機會先發,造成左投無身高越高,
出賽數越少的情形?
以上純屬個人推測,我也有點霧煞煞
無論如何,我相信身高與投手成績確實沒有關聯的,我認同Herlin大大的說法,跟屌毛比較
有關係