感謝f大的發文,我也是長知識了
我得再次承認我對NN的理解太膚淺,這是我做得不好的
一方面是因為我是做RFIC的,我沒那個能力時間把 NN 和 MCTS 的結合寫得精確
(我就只是在一月ASP-DAC做了 turorial 的 chair 聽了一整天NN,和看了那份 Nature
寫這篇也參考了那個台大資工教授的文章)
另一方面是由於我所寫的出發點是在,我希望借助我有的圍棋知識和我比較熟知的 MCS
還有一些對於 AyaBot 的經驗,去推估 AlphaGo(AG) 的可能弱點
而不是要告訴人 NN 如何在 AG 發揮作用,所以引出你這篇好文啊 XD
只是我不能同意 NN 是 AG 強的關鍵,
因為 NN 和 MCTS 是一起配合的,只有一方的情況下,過去的經驗會告訴你它會弱很多
只有 NN 的話可以想像有可能發生,在第一局第7手下出未見過的佈局,
AG 下一手就開始不會下,然後脆敗
我知道 NN 是協助 MCTS 更有效率地找出最佳解 (類似 MC 跟 MCMC 的分別)
用圍棋的話來說,NN 相當於一個形勢判斷 + 一個不強的算路 (相當於棋手第一感)
MCTS 就是在 NN 的協助下加強算路的能力,其實跟棋手的思維模式是很接近的
那麼我將 NN 的助益完全算進 MCTS 的 sims 數提高,去估算 AG 的算路深度是合理的
第四盤我看完圍棋TV張東岳的講法,
我會說如果 78手 是勝著,那麼 35手 虎 就是敗著,沒有虎而是黏,後面就不會有78了
也就是我上篇估計的三四十手算路
當然由於它有 MCTS 的關係,它在沒改 code 的情況下,遇到同樣的 78手,
它有可能會平安運轉
我的看法是 Google 太小看李世石,如果1000台 server 增到2000台,說不定就夠了
有人可能說 distributed 版跟單機版的勝率才77%,
但從十番棋的角度3勝1敗已經接近把對方打降級了)
從兩個現象看來,你不能抹殺 MCTS 的作用
1. 第二局的那個五路肩衝,那大概不是 NN 提供的優先選擇吧,非得 MCTS 掃出來
當然五路肩衝在職業譜也不會沒有,
我記憶中武宮有五五肩衝星位的棋吧,那更是對兩邊來說都是五路肩衝,
最近的棋也好像有吧,不過沒有在佈局的那麼早段下
而是其他很多地方都定型後再肩衝五路的場合下法
但樣本數少到單用 NN 是不可能建議你去下這種棋的,
但那個小機率權重讓它能在 MCTS 中脫穎而出
2. 昨天敗定後,AG 下出很多到無禮程度的業餘下法,那也是 MCTS 的「功勞」
它相當於下出很俗的打將式絕對先手,然後期望對方氣合脫先,從而得益
這在機率上就說得通了,但在下得很業餘這個點上,它就變成丟下 NN 的 AI 了