[心情] 李世石 Go! Go! Go! bbbtri PTT批踢踢實業坊

[心情] 李世石 Go! Go! Go!

作者: bbbtri (cycling) 2016-03-11 23:59:20

本來想問這裡沒有人有可以出來解釋一下這篇(講AlphaGo用的演算法)
http://benkampha.us/posts/2016-03-11.html
(不過不知道為什麼, 連結好像失效了?)
只大概看了一下, 因為連什麼是hand coded evaluation都一頭霧水啊 XD
其中提到兩種演算法, 一組叫policy network，用來模仿人類的棋步, 很妙
另一組是value network，用以判斷一個棋步有多少價值(應該無關好壞，而是目數)
前者還有分階段, 先supervised後reinforcement
而後者並不是放手讓電腦自行去繞，而是有給點指示
大概是這樣, 不過我更想知道這個convolutional neural networks是什麼？
和節點的類神經網路有什麼不一樣啊？
希望版上有神人可以解答 @_@"
以下是我自己昨天看棋的感想：
做為一個曾經的棋迷, 我在2004-2008年間看過很多棋賽
那時會和朋友用MSN Live討論的比賽(自LGS、棋聖道場、幽玄之間等的轉播)
或從奇譜士找我們有興趣的舊譜來討論
感覺身為棋迷很幸福啊, 因為網路上資源相當豐富
論壇人多, 又值棋界動盪不安, 很多八卦可看XD
比方說, 在當時個性和作風就很妙的小李
那時還是大李比較強, 但已壓不住他的風頭
所以小李在09年突然說要停職時, 雖然我已漸漸不太看棋了, 還是很錯愕
他一直都有驚人之舉, 但當時正是他全盛的時候啊!
沒有職業棋手會在自己剛27歲, 迎上頂峰的時候說要「暫停」!
那時應該是所有人都看壞一年多後回來的他
覺得沒有棋士

作者: arnold3 (no) 2016-03-12 00:03:00

人類若只能還在用形容詞來描述棋局時注定離電腦一大截

作者: notmuchmoney (真的不錯....) 2016-03-12 00:15:00

賽前李世石對環境也沒太多要求也許沒料到挑戰如此巨大

作者: fgkor123 (n(N)) 2016-03-12 00:23:00

http://goo.gl/XfKUNc 這兩篇應該有幫助http://dataunion.org/11692.htm

作者: Rubio5566 (盧比歐) 2016-03-12 00:25:00

第二篇連結失效了

作者: fgkor123 (n(N)) 2016-03-12 00:27:00

http://dataunion.org/11692.html 正常阿QQ好像少l

作者: ginstein (邁向學術之路) 2016-03-12 00:29:00

https://www.zhihu.com/question/39905662

作者: fgkor123 (n(N)) 2016-03-12 00:31:00

那兩篇是架構cnblogs.com/fengfenggirl/p/cnn_implement.html這篇只談CNN，附程式碼和github連結

作者: sadmonkey (下雨天) 2016-03-12 00:40:00

分享一下個人對演算法的理解，AG每步棋下棋模式就像是一位長期練習後的業餘棋手，已經懂得每步棋要下時大約可以下的哪五步棋比較好，而這時他會請一千名跟他同等級業餘棋手分五組兩兩配對來對那五步棋開始下，直到下完這一千盤統計這五步哪步勝率高，最後就決定下那步。而AG的長期練習就是不斷的跟自己同等級的人下，每步棋依據前面的下法，每局下完後會依據勝負檢討黑方白方誰下的好，並就依勝負加權那方中間下過的每步棋，而且他記憶力驚人永不忘記，體力驚人永不會累，並永遠可以找到一位跟他一模一樣棋力的人下，經過上千萬棋局的自我修練後來跟人類下棋。只要他檢討棋局的方向正確，他就會一直的進步下去，而

作者: NaoGaTsu (那歐卡茲) 2016-03-12 00:42:00

簡單說就是鳴人的影分身之術外掛練等法。(無誤

作者: fgkor123 (n(N)) 2016-03-12 00:43:00

另外你講的是這篇?http://zhuanlan.zhihu.com/yuandong/20607684還是http://benkampha.us/

作者: sadmonkey (下雨天) 2016-03-12 00:44:00

過去即使用影分身可能要練一百年，AG找到精神時光屋所以練了四年打敗樊麾，多練半年打敗李世石

作者: wadashi1 (阿拉丁) 2016-03-12 00:47:00

我去爬了,早在13年前黃士傑就做過電腦圍棋打劫的策略論

作者: fgkor123 (n(N)) 2016-03-12 00:47:00

明顯你網址多了/posts XD

作者: wadashi1 (阿拉丁) 2016-03-12 00:48:00

文.http://goo.gl/utCkwl 接下來李世石要用打劫的方法對

作者: sadmonkey (下雨天) 2016-03-12 00:49:00

用deepmind來研究圍棋是近四五年才開始成立的公司

作者: wadashi1 (阿拉丁) 2016-03-12 00:49:00

對阿法GO,正好可以見論電腦圍棋對打劫的方法。李世石究竟會不會是自尋困擾呢?畢竟現在的電腦運算太快了!

作者: TaiwanUp (以運動為本的道路環境) 2016-03-12 00:53:00

deepmind打敗職棋的棋風不是aja 我也沒有說AG=DeepmindAG在弈城的帳號也可以是aja的帳號這是多對一的概念#1MswLK3O推論某些局是AG下的

作者: zelkova (*〞︶〝*) 2016-03-12 00:59:00

AG有沒有在弈城下過棋就是一個問題了再來才是AG的帳號是什麼

作者: liaon98 (liaon98) 2016-03-12 01:01:00

不過AG去下網路圍棋鍛鍊也是個不錯的方法吧

作者: TaiwanUp (以運動為本的道路環境) 2016-03-12 01:06:00

7372這篇推論AG有在弈城下過載體是deepmind 80%+是真的

作者: zelkova (*〞︶〝*) 2016-03-12 01:15:00

7373呢? 80%又哪來的還有人說99%呢

作者: TaiwanUp (以運動為本的道路環境) 2016-03-12 01:22:00

7373也是說連勝應該不是aja下的有問題嗎

作者: zelkova (*〞︶〝*) 2016-03-12 01:29:00

你可能沒理解文章他是說 "你可以這麼說但我不這麼認為"

作者: TaiwanUp (以運動為本的道路環境) 2016-03-12 01:31:00

他說"這個狀況，說明了應該有位職業棋手在操刀"所以他說不是aja下的沒錯呀

作者: zelkova (*〞︶〝*) 2016-03-12 01:32:00

後面那段是什麼可以唸出來嗎??

作者: TaiwanUp (以運動為本的道路環境) 2016-03-12 01:36:00

不可能達成那麼驚人的(9d)連勝成就

作者: zelkova (*〞︶〝*) 2016-03-12 01:38:00

我覺得你很有當記者的淺力..「這個狀況，說明了應該有位職業棋手在操刀，從 Alphago的棋感覺不出來，可以在九段達成那麼驚人的連勝記錄，除非他有所謂的：遇強則強，遇弱則弱的狀況，所以我覺得應該是有職業棋手接手了 Aja Huang 的號在下，而不是Alphago 在下。」

作者: TaiwanUp (以運動為本的道路環境) 2016-03-12 01:42:00

所以確實他認為不是aja下的沒錯呀要9d連勝也接近世石了aja有必要或有能力請到這種棋手來幫他代打或測試嗎

作者: zelkova (*〞︶〝*) 2016-03-12 01:44:00

但是你沒發現人家在分析的時候都是持保留態度而不是把「AG在弈城的帳號...」掛在嘴邊

作者: TaiwanUp (以運動為本的道路環境) 2016-03-12 01:44:00

而他前面也有說如果之後公佈是AG那他也認了從前兩戰結

作者: zelkova (*〞︶〝*) 2016-03-12 01:45:00

這樣跟那些在說這次有不打劫協議的人有什麼差別

作者: TaiwanUp (以運動為本的道路環境) 2016-03-12 01:46:00

果看來保守猜測是AG應該沒問題吧說有不打劫協議是不承認真實我不承認aja能連勝九段和7373這篇的想法一樣都是認同真實事實的行為

作者: zelkova (*〞︶〝*) 2016-03-12 01:51:00

雖然大家想法一樣但是結論完全不一樣你高興就好恩晚安

作者: TaiwanUp (以運動為本的道路環境) 2016-03-12 01:54:00

如果你認為aja能連勝九段才是無異於不打劫協議派的人是潛力不是淺力記者至少分得清楚這兩個字

作者: zelkova (*〞︶〝*) 2016-03-12 08:19:00

你也沒搞懂我意思我沒說aja一定能連勝九段至少得有證據不然柯潔懷疑有不打劫協議->網友說估狗有不打劫協議陳經懷疑deepmind就是AG->網民說AG就是用deepmind這中間哪裡有差別? 最後還自己加個80% 完全就自己定論了

作者: TaiwanUp (以運動為本的道路環境) 2016-03-12 15:20:00

我有斷句不是在引用數據不要搞文字獄

繼續閱讀