Re: [討論] AlphoGo什麼時候在長考？ mathbug PTT批踢踢實業坊

Re: [討論] AlphoGo什麼時候在長考？

作者: mathbug (天堂的定義) 2016-03-11 08:52:07

※ 引述《mathbug (天堂的定義)》之銘言：
: 我覺得這是一個很有趣的問題
: AlphaGo 什麼時候長考？就是什麼時候要花很多時間計算？
: 理論上，當人類對手在思考下一手的時間
: AlphaGo 也可以用自己的邏輯(value function)〝幫〞對方選出最佳的幾個點
: 然後同時思考自己的對策
: 一旦人類對手的落點不在自己選出最佳的幾個點時，一切又要重新計算了
: 換言之，當AlphaGo長考的時候，表示人類對手的選點不同於自己的邏輯
: (非電腦判斷分數最高的幾個點)
: 也許好好在重播中觀察AlphaGo的長考時間點可以多瞭解它不同的邏輯
第一盤 AlphaGo 好幾手花很多時間在思考
導致AlphaGo用時也非常可觀(第二盤AlphaGo用時少很多了)
顯然李也給AlphaGo出了難題
甚至於行至中盤右下角白棋沒做活之前很多高手仍然認為黑棋佔優
第三盤的最佳策略應該如下：
1. 相同開局，AlphaGo 應該會相同應對直到李世石自己認為的問題手
2. 真心認為人類要(好好看重播) 知道怎麼下才會讓AlphaGo重新花時間計算思考
唯有這樣才能讓AlphaGo有前後策略不連貫的機會
3. 前半盤沒優勢(戰略階段) 後半盤應該沒機會(戰術階段電腦計算大勝人類)

作者: agreerga (鴨毛) 2016-03-11 09:03:00

如果下一模一樣的步法 AG會同樣策略嗎?

作者: sarraya (~ No Game No Life ~) 2016-03-11 09:03:00

相同開局未必相同應對，AG最少也會把第一局參入經驗

作者: shyangs (厚呦) 2016-03-11 09:12:00

第一局的經驗是必勝.

作者: fh48105 (網路真慢) 2016-03-11 09:23:00

應該不會相同策略. AG的演算法有加入亂數取點.

作者: newtonyd (newtonyd) 2016-03-11 09:40:00

一定有亂數取點不然對電腦就會出現必勝法(BUG)

作者: SansWord (是妳) 2016-03-11 09:48:00

按照類神經網路的邏輯，這兩場完參數應該又不同了如果這幾天 AlphaGO 都仍舊不斷自我練習的話，兩天後不會是一模一樣的應對....它還在不斷成長阿！

作者: agreerga (鴨毛) 2016-03-11 10:07:00

那如果可以無限反悔有辦法Try出一條贏AG的局嗎

作者: nangle (帥胖汪汪) 2016-03-11 10:36:00

就窮舉法啊樓上

作者: aegis43210 (宇宙) 2016-03-11 12:26:00

無限反悔的話，一盤棋要下幾天？

作者: agreerga (鴨毛) 2016-03-11 13:40:00

下小棋盤來觀察AG的步法?

作者: Danielly (蘋果蟲) 2016-03-12 00:09:00

小棋盤每個點跑出來的權重也會不一樣啊

繼續閱讀

Re: [討論] 李世石 VS AlphaGo 第二局看法redplum Re: [討論] 李世石 VS AlphaGo 第二局看法Nicher Re: [討論] 李世石 VS AlphaGo 第二局看法neutrino [新聞] AlphaGo推手程式以愛妻為名zkow [新聞] 韓媒斥柯潔太毒舌韓網友怒噴zkow Re: [討論] 李世石 VS AlphaGo 第二局看法hayuyang [轉錄] 李世石與 AlphaGo第二局有哪些關鍵之處ted5566 [討論] 李世石 VS AlphaGo 第二局看法wukevinboy [閒聊] 孟泰齡六段評第二戰sky0302 [新聞] AlphaGo靈魂之師:類神經網絡制勝必成無敵zkow