Re: [外電] 普人震怒

作者: agga (小孩)   2014-03-08 08:29:45
※ 引述《tlchen (台灣加油)》之銘言:
:   OPS+ 真的能讓張飛打岳飛嗎?我們來看一個小例子。
:   某甲為十年前某校的畢業生,成績全校第一名,平均分數為 98 分。
:   當年全校學生平均分數為 70 分。
假設標準差7分, 甲的z分數4分
:   某乙為今年同一所學校的第一名畢業生,平均分數為 90 分。
:   今年全校學生平均分數為 60 分。
若標準差10分, 乙的z分數是3分
甲是比乙好的
棒球員到底要用ops+比還是用z分數比
應該還不知道哪種比較好
標準差的資料也不知道去哪找
:   為了能讓甲乙相比,某丙創造了一個 score+,
: 公式是個人成績除以全校平均再乘 100
: 根據 score+,某乙 150 海放某甲的 140,是個較優秀的學生。
:   發現這樣論證的問題了嗎?score+ 或 OPS+ 這種東西,
作者: nickyang (肌腱炎者少打字)   2014-03-08 08:38:00
Baseball databank可以download攻擊數據都是可以免錢跑的
作者: tlchen (台灣加油)   2014-03-08 11:27:00
若有碩士主修統計的,若剛好有指導老師願意幫助玩這些資料我相信是很有機會海放目前的棒球統計
作者: OalexO (fight!)   2014-03-08 11:40:00
海放? 樓上真當美國那些數據專家沒統計背景嗎...
作者: idtvgame (唉低電視遊戲)   2014-03-08 11:46:00
台灣就有經濟統計碩博士生在寫運動相關的論文了...
作者: idtvgame (唉低電視遊戲)   2014-03-08 11:47:00
經濟學也有運動經濟學這塊還有期刊 多的是在跑計量的論文
作者: tlchen (台灣加油)   2014-03-08 11:51:00
期刊,研討會都有,統計界每年的大拜拜,也有運動統計問題是有多少人,多少心力真正投入
作者: tlchen (台灣加油)   2014-03-08 11:53:00
若一開始的人稍微有點統計概念,就不該是OPS+這種觀念出現
作者: idtvgame (唉低電視遊戲)   2014-03-08 11:59:00
所以這跟你"有碩士主修統計且教授願意幫助就能海放"
作者: idtvgame (唉低電視遊戲)   2014-03-08 12:00:00
你這種講法好像都沒有念經濟統計的人在做這塊一樣~
作者: aborwang (Abor)   2014-03-08 12:13:00
推OalexO
作者: onime0704 (おにめ)   2014-03-08 12:21:00
講的數據好像只有OPS+一樣Orz
作者: TRAP   2014-03-08 12:35:00
海放? XDDDD
作者: maxspeed150 (聽說茉夏分手了)   2014-03-08 13:10:00
海放嗎............................................
作者: maxspeed150 (聽說茉夏分手了)   2014-03-08 13:11:00
只能說 紅雀每年付給Tango那麼多錢 紅襪付給James那麼多錢 不是沒理由的
作者: maxspeed150 (聽說茉夏分手了)   2014-03-08 13:12:00
OPS+甚至更進一步的WAR之類你能在BR或FG查到的數據都是給球迷的小玩具 球隊內部的統計工具發展比這複雜多
作者: maxspeed150 (聽說茉夏分手了)   2014-03-08 13:18:00
抱歉記錯 Tango現在是小熊的人
作者: chordate (封侯事在)   2014-03-08 13:34:00
說海放的真是搞笑,你能海放早就被付錢請去了
作者: chordate (封侯事在)   2014-03-08 13:35:00
OPS+是好算又誤差不會太大
作者: chordate (封侯事在)   2014-03-08 13:37:00
真的當Sabermetrics只有這點東西啊?
作者: IAmaMouse (我是一隻老鼠)   2014-03-08 14:06:00
原來美國球團都是槌子, 便宜的學校學生不找, 去花大錢買隨便都會被海放的垃圾
作者: tlchen (台灣加油)   2014-03-08 14:48:00
數據當然不只有 OPS+, 還有像是討論價值用 WAR
作者: tlchen (台灣加油)   2014-03-08 14:49:00
統計量本身沒有錯,但不知統叶量該怎麼用,被海放只是剛好
作者: tlchen (台灣加油)   2014-03-08 14:50:00
機密的東西,做到多好,看不到無法評論
作者: tlchen (台灣加油)   2014-03-08 14:51:00
但以目前 Sabermetrics 所公開展現的東西我是真的認為,碩士生就能做得比他們好
作者: maxspeed150 (聽說茉夏分手了)   2014-03-08 14:52:00
FG或BR這種放來給大家wow一下的數據本來就是如此
作者: tlchen (台灣加油)   2014-03-08 14:52:00
當然,若是跟著目前主流 Sabermetrics 的作法,那不會有
作者: maxspeed150 (聽說茉夏分手了)   2014-03-08 14:53:00
同 但是talent分布理論上差距不會太大
作者: tlchen (台灣加油)   2014-03-08 14:53:00
什麼特別的東西.得要自己重新去想想,到底怎樣才是合適的
作者: tlchen (台灣加油)   2014-03-08 14:54:00
WAR 要衡量 talent, 我沒有太大的意見
作者: tlchen (台灣加油)   2014-03-08 14:55:00
但要來衡量貢獻度,那叫掛羊頭賣狗肉
作者: idtvgame (唉低電視遊戲)   2014-03-08 14:55:00
你為什麼這麼有把握你幻想中的碩士生能想出一個"特別又
作者: chordate (封侯事在)   2014-03-08 14:56:00
衡量talent比衡量貢獻渡還難耶=.=
作者: maxspeed150 (聽說茉夏分手了)   2014-03-08 14:56:00
t大上次吵過一次的論點我還記得啦 他就是認為關鍵時刻的關鍵一擊才是貢獻度的重點
作者: tlchen (台灣加油)   2014-03-08 14:57:00
不用特別又創新,而是適不適合.就像 z-score 就足以海放那些 xxxx+
作者: chordate (封侯事在)   2014-03-08 14:57:00
那早就有WPA滿足你對關鍵一擊的的重視了
作者: maxspeed150 (聽說茉夏分手了)   2014-03-08 14:58:00
xxxx+是個簡單的數據 只是代表一個球員"比平均"好多少
作者: tlchen (台灣加油)   2014-03-08 14:58:00
我的確認為在衡量貢獻度上,WPA 遠勝 WAR
作者: tlchen (台灣加油)   2014-03-08 14:59:00
貢獻度是看已發生的表現,而不是預測未來的表現或本身能力
作者: chordate (封侯事在)   2014-03-08 14:59:00
你確定大聯盟是常態分佈再來用z-core
作者: tlchen (台灣加油)   2014-03-08 15:00:00
z-score 也同樣可以看比平均好多少
作者: tlchen (台灣加油)   2014-03-08 15:01:00
我前面也說過,z-score 用來看極端值一樣不可靠
作者: idtvgame (唉低電視遊戲)   2014-03-08 15:01:00
如果你覺得標準化這麼有代表性 歡迎寫一寫你投期刊....
作者: tlchen (台灣加油)   2014-03-08 15:03:00
我不認為 z-score 比 xxx+ 有代表性,能投上什麼期刊 :)
作者: idtvgame (唉低電視遊戲)   2014-03-08 15:04:00
我只是想做 做這些東西的人很多..沒有您講的這麼不堪這樣
作者: tlchen (台灣加油)   2014-03-08 15:04:00
看統計量,看它跟平均的比,去問問哪個統計的人信服當然啦,除非是大家已知那統計量要取 log 來處理比較準
作者: tlchen (台灣加油)   2014-03-08 15:05:00
像是照片中的 intensity
作者: idtvgame (唉低電視遊戲)   2014-03-08 15:05:00
就我看Journal of Sports Economics裡面最少超過20篇
作者: tlchen (台灣加油)   2014-03-08 15:06:00
在那樣的情況下,看比例,等於看 log 後的差距
作者: idtvgame (唉低電視遊戲)   2014-03-08 15:06:00
講棒球的文章在用你所謂的xxxx+ 再做迴歸如果你能講出他們用的東西沒用...那是還蠻值得丟期刊的阿
作者: tlchen (台灣加油)   2014-03-08 15:07:00
20 篇是指 z-score 比 xxxx+ 的比較?
作者: chordate (封侯事在)   2014-03-08 15:07:00
你這一講就漏餡了,你只是認為用減的比用除的好而已
作者: tlchen (台灣加油)   2014-03-08 15:08:00
我只能說,統計的人,根本不可能去認為 xxx+ 有機會而去用
作者: idtvgame (唉低電視遊戲)   2014-03-08 15:09:00
不是 是他們xxx+在當類似球員表現的分析
作者: chordate (封侯事在)   2014-03-08 15:09:00
那一個比較好明明就是要看跟實際狀況預測起來吻不吻合
作者: chordate (封侯事在)   2014-03-08 15:10:00
就像RC公式該不該全是線性組合一樣除非是完全按照打棒球的機制去模擬
作者: chordate (封侯事在)   2014-03-08 15:11:00
要不然線性組合就只是近似而已這是就會有人跳出來說,棒球的分數哪裡是這樣生成的
作者: chordate (封侯事在)   2014-03-08 15:12:00
所以這個不對怎麼樣的
作者: nickyang (肌腱炎者少打字)   2014-03-08 15:16:00
岔題,Z score,12-13 trout 2.6,01-02 Pujols 1.5
作者: nickyang (肌腱炎者少打字)   2014-03-08 15:17:00
樣本為PA qualified打者。待會做全打者
作者: nickyang (肌腱炎者少打字)   2014-03-08 15:18:00
12-13比01-02近似常態,1213 avg .338, stdev .078
作者: nickyang (肌腱炎者少打字)   2014-03-08 15:19:00
01-02 avg .351 stdev .062. 做完再上圖
作者: maxspeed150 (聽說茉夏分手了)   2014-03-08 15:20:00
用wOBA做的?
作者: chordate (封侯事在)   2014-03-08 15:21:00
問一下資料來源是http://www.baseball-databank.org/嗎
作者: nickyang (肌腱炎者少打字)   2014-03-08 15:23:00
IQR/1.35 0102=0.03 1213=0.04
作者: tlchen (台灣加油)   2014-03-08 15:24:00
看跟實狀況預測起來吻不吻合?是要叫張飛跟岳飛真的打一場?
作者: nickyang (肌腱炎者少打字)   2014-03-08 15:24:00
作者: tlchen (台灣加油)   2014-03-08 15:25:00
若有興趣,不如隨便找兩個 mean 不是零的分佈,然後各抽樣
作者: tlchen (台灣加油)   2014-03-08 15:26:00
樣個幾百個,然後自己看一下,z-score 跟 xxx+ 那個比較準
作者: Yukirin (いい天気!)   2014-03-08 15:27:00
海放 XDDDDDDDD我每天鑽這個都沒這自信了你什麼豹子膽啊XD
作者: tlchen (台灣加油)   2014-03-08 15:27:00
多做幾次,或許就有感覺,這為什麼根本沒什麼好爭論的
作者: chordate (封侯事在)   2014-03-08 15:28:00
找exponential distribution 出來的結果不就好了
作者: tlchen (台灣加油)   2014-03-08 15:32:00
如果你認為 exponential distribution 合理,那你贏了前面已經推過,除非已知取 log 後來處理是比較有意義的
作者: chordate (封侯事在)   2014-03-08 15:33:00
已知已知,不要忘了已知是怎麼來的
作者: tlchen (台灣加油)   2014-03-08 15:33:00
你認為那些數據該先取 log 的話,那我也不便多說什麼了
作者: ChaosK (三星手機炸飛機)   2014-03-08 18:12:00
為什麼一定要張飛打岳飛,可不可以關羽打項羽?
作者: best2008 (靜香愛洗澡)   2014-03-08 19:25:00
都不要看數據 就好了(誤
作者: fan0226 (YI)   2014-03-08 19:56:00
任何數據都不是完美的qq
作者: TSbb (貸款三十年債開始)   2014-03-11 15:58:00
海放勒,超好笑的

Links booklink

Contact Us: admin [ a t ] ucptt.com