晚上再來一次回完
先說昨天那個很厲害的投手
來個不同狀況下的球種比例表
http://imgur.com/BNbry1W
不同狀況下的球數比例表
http://imgur.com/BELD4WF
各球種及位置分布圖
http://imgur.com/Vhh8Yqr
再來那個很厲害的左打
各位置的打擊熱區圖
http://imgur.com/ubeMYJN
細分對右投54個打席的全球種落點圖
http://imgur.com/dGCXd3G
對左投41個打席的全球種落點圖
http://imgur.com/gU2ieZm
基本整個數據分析工作,大概可以分成幾個部分
設計系統、做紀錄、看報表、寫結論
如有需要可以從記錄欄位引申一些其他功能
一般人可能以為紀錄完就好了
當然不是,我的確紀錄完可以馬上跑出報表
報表裏頭自然就是依據各方請教,了解教練球員的思維
所設計的一些圖表
一個球員的報表,大概會跑成5-6張PDF
為何不用系統來查詢?
因為資料太多了,比賽中又不能查
所以印出來翻比較方便
一個球員5-6頁,代表一隊將近要100頁
教練球員要比賽、要訓練,還有每天搭車移動
說實在四隊看完球季都結束了
所以就需要有"數據分析師"這種人
每天就看這些報表,有無特殊有趣的數據可以提供給教練團
大約一個球員,1-2句話就很多了
太多干涉我也覺得沒意義,不用這麼愛刷存在感啦
球又不是我在打的,拿冠軍我也噴不到香檳
還有也許看了看,會想到其他的邏輯
例如我最近在研究的投手第一輪、第二輪、第三輪的配球差異
然後再拉出原資料庫,再試跑看我這個假設是否有顯著的差異性
如果真的有,就考慮寫進自動跑出的報表
然後報表又會再多幾頁了......
球團常覺得我太貴
應該是以為工作不過就是寫系統、做紀錄
而沒有考慮到"數據分析師",把很多的資料萃取成最後兩句話要花多少精神
當然這也不用勉強第一線的球團人員
他們真的很辛苦,要承受各方壓力
還要從有限的預算中來想辦法,我至今都還蠻感謝他們的
中午爆掉那篇
個人經驗是提出討論,教練團都會很樂意提供意見
可是球團是付錢的人,球隊是比賽的,基本不太經手錢的事情
那位朋友當時沒簽約沒錯,有無提過費用?
以我的了解,球團人員應該不是會賴帳的(雖然我最後沒有談成XD)
畢竟賴了也不會進自己口袋,大家都是領薪水的,幹嘛這樣呢?
有人問紀錄可否自動化、或是阿發狗那些
美國的狀況,印象中是每一支球團給大聯盟官方一千萬美金,是每一球團喔
讓大聯盟官方找廠商在每一個球場裝一些硬體
然後收集下來的資料提供給各球團
好像只是提供,要怎麼分析看你自己,要放旁邊不用也行。但錢還是要付
以上是我聽來的第N手資訊
感謝提醒,上面的金額是錯的
他會收集球員、球等等的移動數據
這種"數字"上的資料,當然可以自動化。就像測速槍一樣
但是"屬性"上的資料,就還是需要人來填
例如好壞球
好壞球他的系統絕對可以幫你判,還判得非常準,問題好壞球又不是機器決定的
還是你要在主審右手上裝sensor? 那這樣絕對可以自動化
當然,厲害的系統可以把一些屬性資料用邏輯來幫忙填寫
就可以讓紀錄系統減少一點人工
但考量目前的經費問題,還是多以人肉紀錄為主
機器可以模擬總教練的思維,告訴你要怎麼打嗎?
我個人認為是不行
不過猜猜對手戰術思考模式,例如提前離壘、短打、甚至pitchout等
我是有在思考怎麼呈現啦
要跑出來一定有,問題在於若不夠顯著,就不用囉嗦
因為下棋,你要棋子放在哪裡,他就在那裏
投球打球沒有那麼準的好嗎
不要說台灣,日職投手參加九宮格挑戰,有幾個可以全破的?
揮棒也是阿,也許打者前一打席被擠到,剛好手痛揮棒軌跡跑掉
然後矇出小安打。這要殺機器的頭謝罪嗎??
我還是認為,球是球員在打的,數據只是輔助,不用太自以為是
另外S大納篇我也有思考過一些
數據資料能提供多少,有沒有讓教練們覺得地盤被佔
以我接觸的狀況來說,他們是可以接受一些新思維的啦
不過我覺得要分幾個層面來說
技術面、情報面、戰術面、戰略面
技術面部分
用膝蓋想也知道我來講一定沒人鳥
我人生球速最快的時候,大概跟他門國小時差不多
所以這部分絕對不用插手
情報面
如果提供的是在什麼狀況下,對手什麼行為機率高這種
他們會很樂意了解,也就是我目前最主要提供的資訊
戰術面
例如要不要閃這個,拼下一個這種
我認為不用去插手
畢竟總不可能像支小蜜蜂在總教練旁邊
然後隨時嘰嘰喳喳一直在那炒吧
戰術這種,本來就是拼贏的大聲
就算是矇到的也算數
我之道聯盟紀錄都有提供對戰組合
假設某A打者對戰七之一,要拼他,還是對下一個對戰八之三的?
用膝蓋想都覺得是拼七之一對吧
但是聯盟的資料記得是"打席結果"
如果有兩顆是打到警戒區被接殺,抱歉這也算是那六次失敗記錄喔..
這就是用紀錄來分析的盲點,也就是用數據分析的優勢
戰略面
例如選秀、補強那些
首先這些的資料,不是我阿宅看轉播就能作的
如果真的要作
也要大家先了解一些參數的設定、欄位得確認之類
再依一些邏輯來訂定標準
總之,數據能作的不少
但以目前來說,畢竟我們只是個小咖團隊
講太多也沒有人信,所以首要應該是以情報面為主
也許順利的話,再慢慢擴充到其他方面吧