小弟剛剛讀書讀累了,閒來無聊想到一個東西
就是應該有一些人投票的時候會從一號二號一路看下去
但是要一路看到一百多號也是很累的
所以應該不少人都會中途而廢
這樣看起來號次很前面的可能會有一些票數上的優勢
坐而言不如起而行
坐在這邊想不如實際上看看數據
於是小弟就從 shouko 大的票數變化圖(https://zaka46.github.io/tpe48-votelog/graph.html)
提供的 Github 連結(https://github.com/zaka46/tpe48-votelog)找到了最近期的資料
我用的是 20171206.csv 裡面 1512493501 的那筆數據
先來個 disclaimer:統計的手法總是會有盲點,而且我也沒有跑任何 test,所以我在這邊沒有打算下任何結論
為了做一些應該比較有效的分析
我將所有徵選成員每十號 group 在一起,但是把台研拿掉
也就是所有人理論上都是「素人」的身份(不過 112 的數據我懶得拿掉就是了)
這樣就可以假設每個組平均實力都一樣強,當然實際上強弱應該會差很多
上一下表格:
算術平均:32873.5 標準差:19011.7 標準差 / 平均: 0.58 [1~10]
算術平均:21700.9 標準差:10538.6 標準差 / 平均: 0.49 [11~20]
算術平均:13225.1 標準差:9792.5 標準差 / 平均: 0.74 [21~30]
算術平均:14041.7 標準差:15017.1 標準差 / 平均: 1.07 [31~41]
算術平均:12999.8 標準差:13906.9 標準差 / 平均: 1.07 [42~52]
算術平均:9995.9 標準差:12802.7 標準差 / 平均: 1.28 [53~62]
算術平均:15694.8 標準差:9912.4 標準差 / 平均: 0.63 [63~72]
算術平均:15695.4 標準差:13400.7 標準差 / 平均: 0.85 [73~82]
算術平均:10721.2 標準差:7142.7 標準差 / 平均: 0.67 [84~94]
算術平均:14533.6 標準差:21322.5 標準差 / 平均: 1.47 [95~104]
算術平均:29764.8 標準差:25228.7 標準差 / 平均: 0.85 [106~116]
算術平均:12894.0 標準差:10615.7 標準差 / 平均: 0.82 [117~126]
算術平均:20163.1 標準差:16206.2 標準差 / 平均: 0.8 [127~136]
算術平均:17919.2 標準差:14282.5 標準差 / 平均: 0.8 [137~146]
算術平均:6522.5 標準差:4548.8 標準差 / 平均: 0.7 [147~148]
除了平均我還算了標準差跟正規化後的標準差,
第三欄「標準差除以平均」越大代表組內票數多寡的差異越大,
可以看到有很多組別大概在 0.8 上下,超過 0.8 很多的組內應該都找得到票數很高的徵選成員
第一組跟第二組則是最小的兩組,代表兩組組內的票數相對平均
從這份數據可以說,前兩組的票數普遍高而平均,
或許跟號次有關,當然也很有可能是前兩組的成員有比較容易吸引到很多人的魅力點
P.S. 表格的 gist 版在這:https://gist.github.com/qitar888/5df0155f490c08b6c40bf88958213776
P.P.S. 分析的原始碼的在這: https://gist.github.com/qitar888/027047cccde259081dabf9213d051832
P.P.P.S. 看完這篇文請不要起爭議,候補生們都很努力才走到這一步,雖然 48G 的風格好像就是要起一下爭議(?)