Re: [爆卦] AlphaGo發現自己79步失誤 yamiyodare PTT批踢踢實業坊

Re: [爆卦] AlphaGo發現自己79步失誤

作者: yamiyodare (shantotto) 2016-03-13 18:13:52

※ 引述《darkseer ()》之銘言：
: Demis Hassabis推特：(Deepmind 創辦人&CEO, 以下翻譯差勿怪)
: https://twitter.com/demishassabis
: 兩小時前: 李世石下得很好！AlphaGo本來認為自己下得很好，但在87手迷惑了。
: 我們現在有麻煩了...
: 一小時前: 錯誤發生在第79手，但AlphaGo到87手才意識到這點。
: (按: 自然地想跟78手有些關係，不過這裡沒有說明)
: 43分鐘前: 我的『認為』和『意識』，我指的是AlphaGo的價值網路value net，
: 在79手時認為勝率是70%，但到87手就沉下去了。
: (按: 原文只說value net，不清楚是簡稱還是具體單指value network)
: 34分鐘前: 李世石贏了!! 恭喜，他對我們很好的壓迫AlphaGo讓它犯出大錯。
他的意思可能是 AlphaGo 對於 79~86 手之間的盤面
value network 還是評估自己勝算很高, 但在 87 手突然掉下去.
value network (形勢判斷) 訓練出來的值有問題.
應該要更早幾手吐出勝算低的值, 才能避免往這種變化下.
79 是不是敗著不知道, 因為可能 78 一下黑棋就討不了好,
那麼敗著還要再往前推幾手.

作者: arcworld (人生究竟是什麼呢？) 2016-03-13 18:15:00

是的，如果78是小李的逆轉手，那問題肯定出現在更早之前

作者: ilw4e (可以吃嗎？) 2016-03-13 18:17:00

敗著應該是83，右邊不要動直接處理中間應該勝負還未知

作者: BusterPosey (Barca!Giants!Rafa!) 2016-03-13 18:18:00

是不是小李大馬步飛出來跑去右邊肩衝那一棋?

作者: ilw4e (可以吃嗎？) 2016-03-13 18:18:00

再往前推的話可能就69直接下71位就不會有這些後續了

作者: birdy590 (Birdy) 2016-03-13 18:19:00

這狀況代表的通常是這招從來沒看過評估的時候當然漏了

作者: gamania10000 (自助旅行中) 2016-03-13 18:20:00

電腦優勢時會縮小棋盤減少變化.所以形勢判斷很重要

作者: NaoGaTsu (那歐卡茲) 2016-03-13 18:25:00

這篇的理解應該是正確的。形勢判斷部分的策略邏輯應該有問題。

作者: lolylolyosu (3-1次元) 2016-03-13 18:37:00

我覺得跟被吃子有關因為子一被吃盤面就改變了

作者: NaoGaTsu (那歐卡茲) 2016-03-13 18:39:00

跟被吃子應該無關，因為AG會重新估算盤面。

作者: yamiyodare (shantotto) 2016-03-13 18:51:00

看起來勝率陡降是個很好的抓 debug 方式

作者: darkseer 2016-03-13 18:51:00

推，不過我對於value network是不是該稱為形勢判斷有些疑義XD 畢竟形式判斷是個圍棋詞語?

作者: fellwinter 2016-03-13 19:37:00

會驚呼的原因是 79手後黑選擇打劫仍然是占優的局面但是黑選擇放棄打劫卻又下出一連串自損的下法直接導致局面翻轉

繼續閱讀

[新聞] 王檄九段：電腦棋神變棋癡韓國棋手被驚呆qweewqq [歷史] AlphaGo(黑) - 李世石(白) 第四局棋譜zelkova [心得] 出錯與否ForeverOrz [問題] 如果第五戰李世石..paraparapa Re: [新聞] 柯潔：李世石贏回尊嚴電腦挑戰我不夠格Rueyh [新聞] 我們直接問了AlphaGo：敢不敢和中國棋手比zkow [討論] AlphaGo 的可能性弱點giorno78 [新聞] 李世石三連敗於AI　港棋手：他未發揮水準zkow Re: [爆卦] AlphaGo發現自己79步失誤darkseer [新聞] 李世石算出神之一手逼電腦出錯扳回一城 zkow