本來想問這裡沒有人有可以出來解釋一下這篇(講AlphaGo用的演算法)
http://benkampha.us/posts/2016-03-11.html
(不過不知道為什麼, 連結好像失效了?)
只大概看了一下, 因為連什麼是hand coded evaluation都一頭霧水啊 XD
其中提到兩種演算法, 一組叫policy network,用來模仿人類的棋步, 很妙
另一組是value network,用以判斷一個棋步有多少價值(應該無關好壞,而是目數)
前者還有分階段, 先supervised後reinforcement
而後者並不是放手讓電腦自行去繞,而是有給點指示
大概是這樣, 不過我更想知道這個convolutional neural networks是什麼?
和節點的類神經網路有什麼不一樣啊?
希望版上有神人可以解答 @_@"
以下是我自己昨天看棋的感想:
做為一個曾經的棋迷, 我在2004-2008年間看過很多棋賽
那時會和朋友用MSN Live討論的比賽(自LGS、棋聖道場、幽玄之間等的轉播)
或從奇譜士找我們有興趣的舊譜來討論
感覺身為棋迷很幸福啊, 因為網路上資源相當豐富
論壇人多, 又值棋界動盪不安, 很多八卦可看XD
比方說, 在當時個性和作風就很妙的小李
那時還是大李比較強, 但已壓不住他的風頭
所以小李在09年突然說要停職時, 雖然我已漸漸不太看棋了, 還是很錯愕
他一直都有驚人之舉, 但當時正是他全盛的時候啊!
沒有職業棋手會在自己剛27歲, 迎上頂峰的時候說要「暫停」!
那時應該是所有人都看壞一年多後回來的他
覺得沒有棋士