[討論] Alphago會修正第四盤錯誤明天不再犯嗎？ zkow PTT批踢踢實業坊

[討論] Alphago會修正第四盤錯誤明天不再犯嗎？

作者: zkow (逍遙山水憶秋年) 2016-03-14 16:31:16

其實有個很大的問號，雖然阿爾法對外的更新已經中止
但他自己有學習功能
上一場輸給李世石那盤，為了避免劫爭而導致崩盤的情形
不知在第五盤時是否會自動修正這個失誤？
面對類似選擇時，會下別的位置，或勇於打劫呢？
因為有前盤"經驗"，使他不再重蹈覆轍？
不知電腦自動學習功能是如何，會改變他的棋風跟戰略嗎？

作者: shadeel (123) 2016-03-14 16:36:00

直接寫信去問deepmind阿

作者: a1223356 (京) 2016-03-14 16:42:00

谷歌是說這幾場比賽期間他們都沒有調整過電腦，只有收集數據而已，所以只有依賴自我學習。但又有人說電腦比賽完就停機不動了，自然就沒啟動自我學習，所以好像有兩種說法。

作者: nangle (帥胖汪汪) 2016-03-14 16:52:00

這幾天沒有自我學習，第五天的版本就是第一天的版本

作者: indium111 (#ttyhg) 2016-03-14 16:55:00

DCNN的學習模式在比賽前就停止學習了

作者: Marino (馬利諾) 2016-03-14 17:04:00

只要不啟動權重調整程序就不會學習啦下幾盤都一樣

作者: blackwindy (黑色的風) 2016-03-14 17:18:00

其實這樣也不太公平正常來說要啟動學習功能不然高手戰個幾盤看出破綻就屌打了只是阿法狗前面太猛了所以沒人說話

作者: goldduck (哥達鴨) 2016-03-14 17:41:00

有沒有調整只有谷哥自己才知道了這是一場商業秀

作者: NaoGaTsu (那歐卡茲) 2016-03-14 17:44:00

第五盤和第四盤是同版本，沒修bug小李拿到賽後資料回饋時就知道了有沒有修版本了，韓棋院應該也會希望小李釋出他拿到的資料。

作者: MicroB ( ) 2016-03-14 18:08:00

自我學習也跟小李下的那幾盤沒關係跟看破戰無關啦google就說了要針對李世石一千盤李世時棋譜都遠遠不夠而若是靠左右互博五天就能贏那根本不用AG 把AG內的RL拉出來就可以了這東西多算搞不好產生bias棋力還會下降

作者: doom3 (ⓓⓞⓞⓜ③ ) 2016-03-14 18:44:00

不然也修一下崩潰亂下啊

作者: MicroB ( ) 2016-03-14 18:54:00

如果直接加限制條件就是針對圍棋了 deepmind是想展現他們深度學習的強大和適用性所以連局部死活都不算交給神經網不是只要贏而已追求的是不同的美感 XD

作者: jinmin88 (晝伏夜出) 2016-03-14 19:22:00

我記得昨天阿狗輸的時候跳出的視窗感覺是說已存檔..

作者: cloud1030 (不存在22) 2016-03-14 19:29:00

鎖版本了，應該不會微調

作者: bxxl (bool) 2016-03-14 20:03:00

訪問時就有講了啊,每一場比賽的版本都一樣

作者: broodworld (john) 2016-03-14 20:13:00

其實這4盤在樣本數裡應該蠻小

作者: papawalk (~自由之翼~) 2016-03-14 23:06:00

如果鎖版本，反而是小李這幾盤成長，阿法狗停止學習XDDD果斷猜明天小李贏

繼續閱讀

Re: [心得] 圍棋AI AlphaGo 之我見mathbug [新聞] 古力評柯潔是網紅柯潔慶祝李世石首勝喝醉zkow 從象棋觀點看AlphaGO為什麼會輸ctrl [新聞] Facebook工程師解疑：AlphaGo為什這厲害zkow Re: [轉錄] 「戰勝自己」對於AlphaGo而言不只是口號mgdesigner [棋訊] 今晚七點人機大戰3.4盤實況mariakoutei [影片] 人機大戰第四局，神之一手降臨f845652652 Re: [討論] 人機對戰的熱潮後，要如何推廣圍棋呢?kd1523 [閒聊] 中日韓的民間圍棋風氣盛行度liveforhappy [討論] 比賽可以看書,有助推廣圍棋吧?oooo