抱歉,本來想發在演算法版,但是那邊人實在太少了
關於圍棋
在第二盤結束的新聞稿中與盤中賽評講解一樣,都認為AlphaGo在中段下得很奇怪
柯潔認為,今天李世石輸棋是因為他下的不太好:AlphaGo下的很多棋都不是常理下的棋
,李世石也下的不是常理,很多我都看不懂
所以我猜想
人在圍棋的博奕過程中,假設新手是嬰兒,透過不斷的博奕與閱讀經典的棋譜,其神經元
突觸自然而然的產生了每一個落子後的最佳解(演算法)
所以高手們的落子的行為,即便因為策略不同,但是建立她們神經元突觸的社會是一致的
,所以他們的演算法應該不至於有太大的落差
柯潔之所以看不懂AlphaGo的棋路,正是因為它不是尋著一般情境成長的棋士
因此,我們假定AlphaGo的演算法不是聖杯,我只需等待其模型收斂,我在來求得它的
worst-case
在這樣的情形之下,我只需要背譜即可
可是真的這麼簡單嗎?想知道有什麼地方漏想了