[閒聊] 了解hsreplay可能的數據偏差

作者: Jotarun (forever)   2018-04-24 22:46:15
最近常常逛hsreplay 對裡面很多資料來源準確度有很困惑的地方
今天剛好reddit有個統計學教授發文 https://redd.it/8ejtxd
他提到的跟我想的不謀而合 藉機整理一下重點給大家:
有興趣的可以點進去讀他的全文
因為記牌器 只有你的牌組 對面的要打了才知道 所以
1. 理論上 如果裝記牌器的人是隨機選擇 則不會影響勝率
但實際上會裝的人多半比較在意勝率 或者是實況主
應該算是偏向比較會玩爐石的人
所以可能會讓一些熱門牌組勝率比實際高
所以你去decks那邊看的勝率常常比去meta那邊看的高
2. meta那邊的勝率應該有包含對手的勝率
hsreplay沒有公開他們的演算方法
但是 對手牌還沒打完的時候 很有可能無法判斷對手牌型
像是任務或者奇偶系列很好判斷 但例如西瓜跟控術就不容易了
這就是為什麼在meta那邊有這麼多 其他術士 其他聖騎士
這種選擇性的偏差可能導致20%左右的誤差 而且數據再多也不會修正
3. VSdata 是把記牌方勝率跟對面勝率平均 加上他們牌型辨識相對嚴謹
這種誤差相對就小了不少
作者: studentccccc   2018-04-24 23:55:00
MingZ 說的是
作者: madeinheaven   2018-04-25 11:21:00
記得暴雪之前說過這種統計網站誤差都滿大的

Links booklink

Contact Us: admin [ a t ] ucptt.com