中線定理是敘述三角形兩邊和中線長度關係的一個歐氏幾何定理,
大家在高中數學的三角比(三角函數)章節應該有學過。
根據中線定理,我們可以知道三角形兩邊的平方和,
等於第三邊的半邊長平方和中線長加起來的兩倍。
剛好棒球的數據也可以分為進攻和防守兩大類,
如果我們把三角形的兩邊看作是進攻和防守,
第三邊的半邊長看作球隊氣氛,
這樣的話,中線長是否可以用來預估球隊的勝率呢?
https://i.imgur.com/ZKBdJfe.jpg
秉持著科學的精神,我們來計算一下。
首先,定義球隊的進攻指數,
這裡用了兩種數據,其中之一是OPS,
另一個則是打點數除以打數。
OPS可以反應出球隊上壘跟長打的機率,
而打點數/打數則是跟球隊得分能力有更直接的關聯。
防守指數的計算,這裡採用兩種算法,
第一種算法是單純計算團隊ERA,
第二種算法是除了ERA之外,也把自責分/失分的比例納入計算。
另外,球隊氣氛對戰績也有不小的影響,這裡使用氣氛常數0.801做計算。
所有團隊數據都以聯盟平均數據做標準化。
公式如下:
https://i.imgur.com/yIZsfpC.jpg
以2021年的MLB數據為例,
如果防守指數只考慮團隊ERA的話,
可以看到用上述公式計算出來的中線長跟勝率的R平方值有0.8775。
https://i.imgur.com/c9rZYA3.jpg
如果把自責分/失分的比例加進來的話,
中線長跟勝率的R平方值會提升到0.9002,
顯示這樣的計算可以很好的預測球隊勝率。
https://i.imgur.com/nVQKtNh.jpg
接著,我們將這樣的公式應用在2022賽季,
就MLB的數據來說,
2022賽季數據計算出來的中線長和勝率的相關性誤差比較大,
可能是因為進行場數不夠多,成績的浮動還是較大。
兩種防守指數計算出來的R平方值只有0.6025和0.6635
https://i.imgur.com/jS4fhum.jpg
https://i.imgur.com/eTHQGEE.jpg
那這樣的公式是否也能應用在中職呢?
用2022賽季的中職數據計算可以發現一個有趣的結果,
兩種防守指數的計算的相關性都比2022賽季的MLB更高!
https://i.imgur.com/r4uWmZ6.jpg
https://i.imgur.com/Lrvn7cH.jpg
給直接END的人:結論是棒球中線定理可以作為勝率預測的參考工具。
因為很多人問氣氛常數到底怎麼來的,
讓我們來試試看到底氣氛常數到底應該訂多少比較合理,
因為氣氛常數不能為0,所以從0.05開始,
以下是計算出來的結果,顯示氣氛常數0.801算是滿合理的數字~
https://i.imgur.com/Y6szFpv.jpg