作者:
hayuyang (Cloud)
2016-03-13 15:42:14如題
大家似乎發現alphago面對變化多或變化少勝率差不多 會傾向選變化少的
那alphago和自己下個幾百萬盤
alphago會不會永遠都選擇變化少的呢?
或者說 變化少的他都下習慣了
變化少的一直打反而勝率一直提高
變化多的很少下反而勝率一直降低
他和他自己下會不會導致演算法原本的"缺點"(汙染)會被放大呢?
自己天生避開劫爭
自己跟自己下個一百萬場只是讓這個避開劫爭的傾向變得更加明顯?
作者:
kingrichman (silent all these years)
2016-03-13 15:43:00我是認為如果勝率低於50%,就會陷入只能選低於50%的循環,所以越下越糟
作者:
carylorrk (carylorrk)
2016-03-13 15:55:00training data 的 skew 是很基本的概念,不用替專家煩惱這個啦XD
當汙染率達到400%,AlphaGo將跟人類一起變成柳橙汁
這是有可能的 但不知道純淨的比較強還是棋譜比較強不過現在可能有大BUG
作者:
wnglon (冷面笑匠)
2016-03-13 16:50:00被提掉那八目是重點 就是因為阿發狗亂下一子導致八目死棋