[請益] 關於圍棋

作者: e12518166339 (耐綸)   2016-03-12 20:40:20
抱歉,本來想發在演算法版,但是那邊人實在太少了
關於圍棋
在第二盤結束的新聞稿中與盤中賽評講解一樣,都認為AlphaGo在中段下得很奇怪
柯潔認為,今天李世石輸棋是因為他下的不太好:AlphaGo下的很多棋都不是常理下的棋
,李世石也下的不是常理,很多我都看不懂
所以我猜想
人在圍棋的博奕過程中,假設新手是嬰兒,透過不斷的博奕與閱讀經典的棋譜,其神經元
突觸自然而然的產生了每一個落子後的最佳解(演算法)
所以高手們的落子的行為,即便因為策略不同,但是建立她們神經元突觸的社會是一致的
,所以他們的演算法應該不至於有太大的落差
柯潔之所以看不懂AlphaGo的棋路,正是因為它不是尋著一般情境成長的棋士
因此,我們假定AlphaGo的演算法不是聖杯,我只需等待其模型收斂,我在來求得它的
worst-case
在這樣的情形之下,我只需要背譜即可
可是真的這麼簡單嗎?想知道有什麼地方漏想了
作者: bobju (枯藤老樹昏鴉)   2016-03-12 20:45:00
背譜成不了高手, 中局戰鬥一脫譜你就接不下去了決定棋力的高低的因素之一在於[審局能力], 就是對於當前的局面能夠做出優劣的判斷, 以及預測幾種主要變化的發展趨勢人類具有抽象思考能力(所謂的棋感), 在過去的程式主要是靠決策樹來模擬, 推演各種變化並以計分的方式決定出下一步該怎麼下? 對上圍棋這種空間複雜度極高的遊戲顯然一切實際,這也是在此次比賽之前人們普遍認為人類仍能憑著抽象思考能力佔優勢, 殊不知這代的AI居然也能展示出類似人類抽象思考能力的面向, 而且更勝一籌.改錯字: [一]切實際 <- [不]切實際
作者: bibo9901 (function(){})()   2016-03-12 21:06:00
你漏想了蒙地卡羅演算法, 漏想了neural nets, 漏想了reinforcement learning, 我還真想知道你想了什麼?
作者: e12518166339 (耐綸)   2016-03-12 21:08:00
抱歉功課沒有作足,我需要再好好的學習一下
作者: remmurds (Stronghold)   2016-03-12 21:26:00
你漏掉了圍棋和西洋棋最大的差異 圍棋沒有明確的目標西洋棋的目標很明確 (拿下國王)
作者: PRAM (PRAM)   2016-03-12 22:12:00
就算想了蒙地卡羅,類神經,XX學習,你能做出AlphaGo?
作者: goldberg123 (SmallHanWinchest)   2016-03-13 00:22:00
你看的懂高手的下法你就不會在這發文了

Links booklink

Contact Us: admin [ a t ] ucptt.com