雖然不是很想一直發有可能會引戰的文章,但是這個討論我覺得很有趣
所以我來試著解釋一下我對於什麼是簡單,什麼是困難
還有直接推廣 FIPS 會遇到什麼障礙的想法
: 推 nickyang:我想你剛好講反了,BABIP之所以是障礙是因為你已經被ERA 06/15 04:27
: → nickyang:洗腦。對沒有ERA觀念的人來說,三振多保送少=強有什麼障 06/15 04:28
: → nickyang:礙可言? 06/15 04:28
三振保送這部分我沒有問題
但是我總會覺得投手強弱不只三振保送
像有人每打出很多很強勁的球 有人被打比較多小飛鳥滾
這些東西 FIP 沒有計入,我不太知道原因
是因為 (1) 因為投手無法控制被打進球場的球的結果 (BABIP說)
還是 (2) 因為這對投手的表現沒有解釋能力或解釋能力很弱?
如果答案是 (2),那 FIP 對新手來說又更難懂了(因為他要懂統計才能懂 FIP)
請看我以下的說明
: → nickyang:再則,很多參與這串的應該都不知道DIPS這三年進展很大 06/15 04:29
: → nickyang:如果你知道DIPS這幾年的討論,對老手的障礙已經幾乎沒了 06/15 04:30
: → nickyang:最後一樣的問題,為什麼講到解釋ER這麼複雜又不合理的 06/15 04:31
: → nickyang:東西每個人都以為很簡單,講到三振多保送少=強每個人都 06/15 04:31
: → nickyang:覺得很複雜?三振多保送少不被尻炮就是好投手,多難懂? 06/15 04:32
: → nickyang:先忘掉你腦裡的ERA,DIPS一點都不難懂 06/15 04:33
在說什麼是簡單/困難之前,我覺得要先把定義說清楚
SIMPLE 不等於 EASY, COMPLEX 不等於 DIFFICULT,這是首先要理清的一個命題
並不是玩文字遊戲,請看以下的解釋
simple 或 complex 衡量的是一件事情的 "複雜度"
就是說要操作這件事情有多難搞
easy 或 difficult 衡量的是一件事情的 "難度"
就是要理解它有多困難
當然有很多事是 simple and easy 或 complex and difficult,那大家都可以說
前者簡單、後者難,輕易就可以結案
我覺得為什麼 ERA vs DIPS 會論戰這麼久
而且明明知道 DIPS 就是比較好(解釋能力強)的數據
ERA 在大眾媒體(不包括做 sabermetrics 的專家)的地位卻依然不動如山
關鍵就在於前者是 complex but easy,後者是 simple but difficult...
要搞懂 ERA 就要搞懂 ER,而 ER 的計算有很多奇怪的規定,不精準,沒錯
有時候還牽涉很多人為判斷(怎樣子叫失誤?)
但是規定是可以窮舉的,全部寫在白紙黑字之後,就可以無腦地操作
而且這個規定經過多年修改,已經很詳盡
所有場上的情形(先不論規定合不合理)都可以直接套用
規定可以很複雜,但是照著跑大家都可以做
而且 ER 是最基本的 counting stat,符合情形就加一
理解上很簡單,會數數字就會,連小學都不用
其實,所有的傳統數據都是 counting stats 或它的加減乘除衍生出來的東西
因為概念上好懂(easy),就是什麼事情發生了多少次這樣
僅管"什麼事情"這個條件發生的規定可以很複雜(complex)
但是只要照著規定做,就可以做出來
也非常好解釋、非常好傳播,而且跟現在場上看見的事情 "直接相關"
所以比較好接受
那進階數據呢?
很多都是統計分析的產物,包含很多 normalization 跟線性回歸的概念
最後的產物可能很簡潔(simple),比如說像 FIP 的公式
FIP = (13HR + 3BB - 2K) / IP + 3.1
本身不難,會小學算術就可以計算
但是背後的概念可比基本數據難(difficult)了不知道多少倍
你要讓人能夠真正理解這裡面的東西,一定免不了要講到一些統計的概念
這些概念我覺得就算再怎麼聰明
沒有國中以上的學力真的就是無法 get your head around it...
我覺得數據頭們認為這些容易理解,是因為已經經過太多科學訓練
這些概念已經深入心中,非常自然… nickyang 我猜你那位朋友也是學統計相關的?
但是大多數人接觸棒球是什麼時候?我想不會晚於國小
試試看跟國小生解釋分布、迴歸?我想應該是解釋不太通的吧
但是你跟他講 counting stat,這邊有一些奇奇怪怪的情形,符合就加一
他應該馬上就可以懂了
而且上篇文章裡戰很大的,像為什麼 HR 要乘 13 這種問題
你要解釋 FIP 的時候絕對無法避免,要解釋清楚一定要講迴歸
那說起來就困難(difficult)了
就是因為理解上的 easy 讓傳統數據能先入為主
至於那些奇奇怪怪的條列情形合不合理?當然不合理啊
但是我覺得會不會去質疑它跟新手老手無關,跟個性有關
想要研究數字的人、堅持有更好的方法去理解比賽的人,就會問這些問題
我覺得說進階數據比較好 沒有疑問
但是說進階數據對新手來說比較易於上手
那除非所講的新手都是有一定學力的成年人,而且有良好的師父可以引進門
不然我真的覺得有問題