※ 引述《tsppajrdrrfs ()》之銘言:
: ※ [本文轉錄自 Gossiping 看板 #1MvIov-I ]
: 作者: n91324 (不丹) 看板: Gossiping
: 標題: [爆卦] AlphaGo發現自己79步失誤
: 時間: Sun Mar 13 17:02:45 2016
: Deep Mind 創辦人在推特表示
: Mistake was on move 79, but #AlphaGo only came to that realisation on around move 87
: 所以AG確實在79有失誤
: 而且她下到87才發現自己之前的失誤
: 補上推特:
: 推 OrzJ: https://twitter.com/demishassabis 推特
從這兩個 twitter 來看, AI 在 79 時仍認為自己有 79% 的勝率,
直到第 87 手時,才發現勝率驟降。四日棋迷猜測如下:
AI 估計勝率是經由之後的模擬,白 78 手被認為神手,但或許是之後
的巧妙變化是不明顯的,所以 AI 無法知道這手有這麼大的功用,或
是說,無法準確的評估此時的盤面。
要知道,AI 的估算是根據之後的模擬,它並沒有人類邏輯式的推演,
所以它不見得能得到之後的最佳變化。某種意思下,它是取模擬的加權
平均,但只要之後最佳的應對沒被模擬到,它的評估自然不準。又或者
是,最佳應對跟其它應對方的結果差很多,若不能給最佳應對接近 1
的權重,那它的評估就失準。
而隨著棋局變化,又多下了幾手,能變化的地方變少,AI 自然比較能
模擬到正確的應對,才驚覺自己已經落後。
這提供了要對付目前這版 AlphaGo 的方法,你最好下一些方法是:接
下來對你的最佳解跟次佳解,結果會差很多,這樣 AI 用模擬的,就有
機會誤判。如果你下的棋,接下來的應對,結果都差不了太多,那 AI
自然估得準。讓它估不準,才會在接下來還沒估準前,繼續出錯。