Re: [討論] DIP, LOB%, shift

作者: kylechen (kyle)   2015-06-06 15:35:43
這幾天聽了N大的開示 小弟有如重獲新生
整個棒球統計觀也因此而有了很大的改變
小弟回去作了一些資料整理 不才只能得到唯一一個結論:
N大實在是太先進了 不要說上太空殺豬公 根本是已經進入異次元
即便在棒球統計聖地美國 像N大這樣的人物 是一個也找不出來
我這麼說是有憑有據的:
比如說這個叫Glenn DuPaul的人寫了篇文章提到了這段:
http://goo.gl/eksWVP
There’s a group of statistics in the sabermetric community known as “
ERA-estimators,” These statistics are based on outcomes that are more under
a pitcher’s control (strikeouts, walks, groundballs, home runs), typically
known as peripherals. They attempt to forecast where a pitcher’s ERA is
going to move in the future.
The most common ERA estimators currently are fielding independent pitching
(FIP), expected fielding independent pitching (xFIP) , skill-intereactive ERA
(SIERA) and true ERA (tERA).
有一類統計數據叫做"ERA-estimators" 廣為棒球數據分析社群所知
........(中間不重要的省略不翻譯 小弟英文太差).............
..這類統計數據嘗試著預測一個投手未來的ERA
目前最常見的ERA estimators 是FIP, xFIP, SIERA, 還有tERA
一個人無知亂寫也就算了 有一個叫做Tom Tango的美國鄉民
竟然還敢出來聲援這篇文章:
By Tangotiger:
A great piece of research by Glenn. They key table is the second one.
http://goo.gl/g8pedm
比對N大的開示:
"不明所以的人看到FIP每年根據聯盟平均ERA做校正,
很容易誤以為FIP 是用來預測ERA
全錯。"
"FIP根本不可能是用來預測ERA的"
"不但預測的效果是沒有意義的 預測ERA 本身都是沒有意義的"
"那為什麼FIP要根據聯盟ERA校正呢?那只是因為大家已經習慣了ERA,
所以把FIP轉換成一個跟ERA 範圍差不多的數據,讓多數人比較容易閱讀。"
超越了發明者Tango大的思維 直言不諱的訓示FIP的真正意涵
同時顯現出對普羅大眾的慈悲與憐憫 神人畢竟跟凡人不同
不過小弟是個凡人 資質大概只能停留在殺豬公的階段
更沒有N大所說的 "預測ERA沒意義" 這樣超然的胸襟
這點所有mlb球團的數據分析部門都要自嘆不如
在這邊跟大家分享一下觀察美國豬公殺手的心得:
其實在美國 利用各種數據分析方法 試圖預估投手未來的ERA
是評估投手的熱門話題之一 大家都在比較誰的方法較準
原因無他 只因為失分多少是球隊最關心的事情
就像一個大師說的(忘了是誰了 別鞭我):
"對我而言這世界上只有兩種好投手
一種是能夠幫助球隊減少失分的
另一種是名字叫做Kyle Farnsworth的"
的確 RA/9 才是失分 但幾乎大家都是預估ERA
理由是什麼 我沒有依據不敢亂說
的確 因為運氣關係 常常會預測不準
但是預測不準不代表就不用預測
只要該結果確實是有實質上的幫助 (比如說簽新投手)
就有繼續研究的價值
就像我們目前的地震預測系統 可以說不準到了極點
但依然還是有部分學者投入在這方面 試圖找出更好的方法來預測地震
預估投手未來的ERA 除了前面提到的ERA-estimators
還有另一派別是Projection Systems 一樣有許多種
(連Tango 大大也作了一個叫Marcel的) 以下的網頁有一些介紹
http://goo.gl/enJBNx
兩派的主要差異在 Projection Systems通常較複雜 但功能也較多
投手部分除了ERA還能作其他預測
並且包含預測打者的部份
廣義的來說 任何東西都能拿來預測未來的ERA
但準不準則是另一回事
這篇文章讓一些ERA-estimators 跟Projection Systems作了大亂鬥
http://goo.gl/K4lPF0
這已經是三年前的文章了
現在應該又出了許多其他新指標
提出這篇文章有一個理由
裡面的結果顯示FIP在各種預測表現上 效果都是倒數的
僅比用現在的ERA來預測未來的ERA好一點而已
為什麼不準的理由 我已經在前面的文章講很多次 不需重覆
所以真的 別再信FIP了
講到如何判斷一個方法/數據
對未來ERA的預測性好不好
有兩個關鍵:
一個是YoY correlation 就是年與年之間的相關系數
顯示投手對某件事的相對控制力
也可以看作是"明年再重現這個數據的機會大不大"
其實N大在前面的文章提過這個了 可惜的是 只看這個是不充分的
必須要再看第二件事:
該數據與ERA的相關性
也就是我在前幾篇文章所作的 把WHIP與FIP,跟ERA去作回歸
這不是我自己發明的 我只是照抄Matt Swartz的方法而已
http://goo.gl/SyMQRl
(Table10, 稍微不一樣的是他對park-adjusted ERA作回歸)
N大:
"為什麼沒有人像我們板友一樣,這麼聰明到拿同一年的各式數據去跟ERA 做回歸呢"
"都已經拿著溫度計在手上了,還到處收集濕度輻射風速去測量溫度,到底是什麼樣的
天才邏輯呢?"
當然 在N大面前
什麼SIERA的發明者Matt Swartz 也只是畜生一個 不算是個人
只是一個傻子在做無意義的事情而已
一樣 我輩凡夫俗子若不能達到那樣的境界
請聽聽為什麼要這樣作的理由:
理由很簡單 舉個例子 投手對自己的名字有沒有控制力?
有嘛! 控制力幾乎是百分之百嘛!
假設我們如果用投手的名字來當作預測未來ERA的指標
我們每年都可以完全重現這個指標
問題是投手名字跟我們想要預測的ERA幾乎沒有相關性
所以預測結果就是一團糟
一個好的預測指標 高重現性 重現後與ERA的相關性 兩者一樣重要
若比較FIP與WHIP
FIP 有較高重現性 但重現後與ERA的相關性低
WHIP 重現性較低 但重現後與ERA的相關性高
WHIP的重現性較低 其實就是我說的重大缺點
很遺憾的N大沒有討論的意願
最後也要謝謝N大 每次讀到N大的回文 總是充滿了驚喜
就好像進入了一個RPG大作一樣 比太空戰士好玩何止千倍
請容我稱之 "尺神幻想曲"
說是大作決不是誇大 比如說
1.DIP沒有S語言 媲美克林貢語
2.LOB%線性 突破物理極限 一上壘必得一分理論
3.各種天馬行空的遊戲內容 粉碎世俗羈絆 各式超越原創者的名詞新解
4.好玩的Shift黑魔法陣 徹底影響打者的運氣
另外算我求N大了 告訴我你的SABR社群好不好?
一個連預測ERA都認為無意義的烏托邦 無論是誰都想去朝聖一下的
作者: iwillloveyou (darren79525)   2015-06-06 18:26:00
水桶他好嗎
作者: fountainNess (秋本平吉千人將)   2015-06-07 11:50:00
故意曲解

Links booklink

Contact Us: admin [ a t ] ucptt.com