[心得] Alphago的弱點

作者: cscscscs22 (QQQ)   2016-03-13 18:39:41
http://www.slideshare.net/ShaneSeungwhanMoon/how-alphago-works
Shou-de Lin Facebook上面最新的文章(一直判定廣告網站不能貼)
這裡有講alphago的怎麼運作的
"反而利用過去學到的policy 結合了蒙地卡羅樹狀搜尋(MCTS)的方法找出最好棋步"
"必須要能夠走出前所未見的局面,降低它對於盤面估測的準確度才會有機會"
可以解釋為甚麼在李九段下出神之一手後就開始秀逗了
alphago利用過去棋譜和不斷自我訓練得一個函數
加上蒙地卡羅樹狀搜尋 來模擬最好的棋步
因為這神之一步是alphago在這幾千萬局中完全沒模擬到的一步
導致模擬全部重來所以之後幾步都下出低級失誤
弱點非常清楚下出alphago沒想出的一步
不過這一步的機會只能用一次
但是因為alphgo能一直不斷學習
這棋譜加入資料庫後同樣的手法就沒用了
所以第五局除非李九段可以下出和今天一樣的神之一手不然沒有機會贏
問題是根本不知道alphago哪些是它下過、哪些是它沒下過的
作者: qweewqq (風一樣的男子)   2016-03-13 18:40:00
其實最有趣的是Alphago不知他在下棋XD
作者: louiswoman (匈奴夫人)   2016-03-13 18:41:00
聖鬥士表示:
作者: cksxxb123 (maxwell)   2016-03-13 18:41:00
希望阿法狗是蘿莉
作者: NaoGaTsu (那歐卡茲)   2016-03-13 18:41:00
這是誤解吧,每一手AG都是獨立模擬計算,沒有全部重來的說法?應該是形勢判斷的邏輯編寫上有問題。
作者: umano (ぎゃああああああああ)   2016-03-13 18:42:00
希望週二能再現奇蹟
作者: zkow (逍遙山水憶秋年)   2016-03-13 18:45:00
我覺得這次李世石在棋界重返顛峰
作者: Ethical (游志傑)   2016-03-13 18:48:00
神之一手!?
作者: MK12 (MK)   2016-03-13 18:49:00
如果他下場順序放法都一樣,也會贏,因為alpha還沒修正,但李不會這樣做,就是了
作者: zkow (逍遙山水憶秋年)   2016-03-13 18:51:00
應該是有很多選擇可以下,不一定會一樣吧就算你跟一般電腦玩,也不太可能按部就班每次就會一樣
作者: qaaz (hiromi)   2016-03-13 18:52:00
這盤棋只是他千萬模型的一個,要影響整個學習成果還早
作者: birdy590 (Birdy)   2016-03-13 19:17:00
這隱含的意義是過去以人類棋譜為主的訓練有問題也難怪已經計畫好要砍掉重練了
作者: Marino (馬利諾)   2016-03-13 19:18:00
神個蛋 感覺狗狗被調過了 顯然deepmind不想太招遙全敗太難看 讓一下輸一場較好 那麼低級的失誤誰相信
作者: liaon98 (liaon98)   2016-03-13 19:23:00
兩方輸了都有人不相信崩潰 板上也不少
作者: profyang (prof)   2016-03-13 19:25:00
果然出現了XDD 我就知道有人會說阿發夠被調過 這跟之前懷疑保密協定是有啥兩樣
作者: DemonElf (LdsFish)   2016-03-13 19:26:00
推"liaon98: 兩方輸了都有人不相信崩潰"XDDD
作者: Tenging (菜鳥)   2016-03-13 19:30:00
alphago以為自己在算數學呢
作者: jyhfang   2016-03-13 19:31:00
進化過的陰謀論嗎 XD
作者: HamalAri (哈馬‧阿里)   2016-03-13 19:52:00
MK12 亂說,MC 每次算出的機率又不會一樣
作者: Wishmaster ( )   2016-03-13 19:53:00
阿法溝的下法有玩過電腦圍棋的應該都看過,只是他是阿發溝,怎麼會犯這種低級失誤 XDDDDDD
作者: DemonElf (LdsFish)   2016-03-13 19:58:00
我覺得現在在講Alphago低級失誤的跟前三盤在講李失誤的的不覺得有即視感嗎?他之所以沒下出好棋是因為對手逼出
作者: smallyuki (smallyuki)   2016-03-13 20:00:00
只能推liaon98了...不知道後天又是哪一方崩潰XDD
作者: DemonElf (LdsFish)   2016-03-13 20:01:00
來的,就像Google說明了AI到87步發覺了79步開始下錯了而79步之後的局面是因為李78步的絕妙好棋造成的
作者: Wishmaster ( )   2016-03-13 20:08:00
我不是指誤算喔,我是指必死棋還補一手和下那種低段才會下的死活棋. 不過也很合理,電腦只會想贏,他哪知道對手實力來決定對方最簡單的死活是否會出錯...
作者: agario (Agar.io)   2016-03-13 20:22:00
其實看過這篇就多半會懷疑AlphaGo的 value net 偶爾會錯了http://goo.gl/3qzyIv <- 奇怪的圖片偶而騙過 netAlphaGo 就是把棋盤當成圖片餵給類似上面文章的 net
作者: Cadd (C+)   2016-03-13 20:33:00
真的, 那步棋就是全場狐疑怎麼會下在那邊以籃球比喻, 失誤可能是投球沒進或運球掉球而那手就好像AlphaGo拿球跑去投自己籃送你分不過這也說明人跟AI的差別, 重要決定還是不能只由AI決定
作者: plaxtic (zuke)   2016-03-14 08:21:00
Alphago沒有資料庫 是靠不停得自我修正程式

Links booklink

Contact Us: admin [ a t ] ucptt.com