Re: [討論]王建民 Chien-Ming Wang

作者: nickyang (肌腱炎者少打字)   2013-03-23 06:17:44
※ 引述《tlchen (台灣加油)》之銘言:
: ※ 引述《nickyang (肌腱炎者少打字)》之銘言:
: : 我用2000-2012的樣本跑了一下,結果相當吊詭
: : coefficient of SB = 0.1492
: : that of CS = -0.102 (t = 1.1)
: : (我本來是用08-12,但CS的p-value實在太大了)
: : 所以也許我們可以說這個decade其實你只要有四成的把握就應該跑?
: 看到這樣的解讀,不禁讓我想起多年前那個第九棒比第三棒重要的統計分析解讀
: http://blog.roodo.com/bubblesld/archives/1257814.html
: 統計不能這樣玩的。迴歸分析只告訴你,在某種模式下,一些變數的關係。
: 在上面的情況,它只是告訴你,若是跑者盜壘的想法不變下(same as 2000-20012)
: 看到盜壘成功跟盜壘失敗的數據,對於得分預測的影響係數為 0.1492 跟 -0.102
: 若你用這個得結果來說,有四成保握就可以跑,
: 那跟用迴歸分析來說第九棒要放比第三棒好的打者一樣荒謬。
: 因跟果要先弄清楚。統計分析通常只是分析果。
我覺得你說對一件事,但誤解了其他
分兩部分講,一部分回應你一部分講我後來的發現
先從你給的連結談,不知道作者是不是你
沒有錯,數字不會騙人,會騙人的是解讀的人,但是錯誤解讀跟以偏概全是一樣荒謬
以那個blog所舉的http://www.beyondtheboxscore.com/story/2006/2/12/133645/296
這篇研究來說,其實作者根本沒有犯blogger想要暗示的錯誤
的確其他人可能錯誤解讀,襪板的討論可能走偏,但是那篇作者有將他的數字解讀成
「好打者應該放在第九棒勝過第三棒」嗎?並沒有
看不懂作者研究方法的人容易這樣錯誤解讀,但你說這是不是有價值的東西?絕對是的
他解釋的是各個位置的margin,如果只能有一個選擇並且成本相同
與其把Cano換成Hamiltion不如把Dan Johnson換成Kotchman
我可以了解你想講的點,但是你那篇研究跟我的問題這兩個例子都找錯了
同樣的,我試圖在證明四成把握就該跑嗎?在文中我用的問號
在後面我補充了很多可能沒考慮的因素,我的目的是討論,像abc拿矩陣圖出來
之前我就沒想過也許這是一條可以解決我的問題的路
你說只有在跑者想法不變下這些數字才能應用在未來的決策,理論上這是對的
不過用你這樣的想法,實際上所有的棒球統計都不能應用了不是嗎?
回歸分析只能描述過去,我在之前討論9個Fielder跟Ryan的文章提過一樣的講法
就算證明九十九隻羊是白羊,我們的確也不能說第一百隻不是黑羊
但用回歸分析預測未來的假設本來就是環境不至於太大的變動,然後發生在過去的事
極可能發生在未來,這樣的假設同樣應用在所有棒球統計的預測系統
不然一句宇宙無常就解決了,還sabermetrics什麼?
而且實際上out of sample的預測能力如何?
假設0.14跟-0.1這兩個數字是對的,理論上這只能表示在00~12這段時間他們的價值如此
但是13年會是完全另外一個世界嗎?possible but not likely right?
如果他們是對的,如果並沒有太多人察覺這一點,比七成把握再盜更冒險的跑非常有可能
帶給球隊被低估的好處
我也說了這可能有surrivior bias,並不表示四成的人就「應該跑」
但是不是表示絕對不可能?如果你試圖證明多數人的解讀方法太大膽
我以為你這種反駁方式反過來可能抹煞太多可能性

Links booklink

Contact Us: admin [ a t ] ucptt.com