[討論] Alphago會修正第四盤錯誤明天不再犯嗎?

作者: zkow (逍遙山水憶秋年)   2016-03-14 16:31:16
其實有個很大的問號,雖然阿爾法對外的更新已經中止
但他自己有學習功能
上一場輸給李世石那盤,為了避免劫爭而導致崩盤的情形
不知在第五盤時是否會自動修正這個失誤?
面對類似選擇時,會下別的位置,或勇於打劫呢?
因為有前盤"經驗",使他不再重蹈覆轍?
不知電腦自動學習功能是如何,會改變他的棋風跟戰略嗎?
作者: shadeel (123)   2016-03-14 16:36:00
直接寫信去問deepmind阿
作者: a1223356 (京)   2016-03-14 16:42:00
谷歌是說這幾場比賽期間他們都沒有調整過電腦,只有收集數據而已,所以只有依賴自我學習。但又有人說電腦比賽完就停機不動了,自然就沒啟動自我學習,所以好像有兩種說法。
作者: nangle (帥胖汪汪)   2016-03-14 16:52:00
這幾天沒有自我學習,第五天的版本就是第一天的版本
作者: indium111 (#ttyhg)   2016-03-14 16:55:00
DCNN的學習模式在比賽前就停止學習了
作者: Marino (馬利諾)   2016-03-14 17:04:00
只要不啟動權重調整程序就不會學習啦 下幾盤都一樣
作者: blackwindy (黑色的風)   2016-03-14 17:18:00
其實這樣也不太公平 正常來說要啟動學習功能不然高手戰個幾盤看出破綻就屌打了只是阿法狗前面太猛了所以沒人說話
作者: goldduck (哥達鴨)   2016-03-14 17:41:00
有沒有調整只有谷哥自己才知道了 這是一場商業秀
作者: NaoGaTsu (那歐卡茲)   2016-03-14 17:44:00
第五盤和第四盤是同版本,沒修bug小李拿到賽後資料回饋時就知道了有沒有修版本了,韓棋院應該也會希望小李釋出他拿到的資料。
作者: MicroB ( )   2016-03-14 18:08:00
自我學習也跟小李下的那幾盤沒關係 跟看破戰無關啦google就說了要針對李世石 一千盤李世時棋譜都遠遠不夠而若是靠左右互博五天就能贏 那根本不用AG 把AG內的RL拉出來就可以了 這東西多算搞不好產生bias棋力還會下降
作者: doom3 (ⓓⓞⓞⓜ③ )   2016-03-14 18:44:00
不然也修一下崩潰亂下啊
作者: MicroB ( )   2016-03-14 18:54:00
如果直接加限制條件就是針對圍棋了 deepmind是想展現他們深度學習的強大和適用性 所以連局部死活都不算交給神經網不是只要贏而已 追求的是不同的美感 XD
作者: jinmin88 (晝伏夜出)   2016-03-14 19:22:00
我記得昨天阿狗輸的時候跳出的視窗感覺是說已存檔..
作者: cloud1030 (不存在22)   2016-03-14 19:29:00
鎖版本了,應該不會微調
作者: bxxl (bool)   2016-03-14 20:03:00
訪問時就有講了啊,每一場比賽的版本都一樣
作者: broodworld (john)   2016-03-14 20:13:00
其實這4盤在樣本數裡應該蠻小
作者: papawalk (~自由之翼~)   2016-03-14 23:06:00
如果鎖版本,反而是小李這幾盤成長,阿法狗停止學習XDDD果斷猜明天小李贏

Links booklink

Contact Us: admin [ a t ] ucptt.com