1. 據說 AlphaGo用到的Neuro Network深達13層
有任何穩定性的報告或是說明嗎?
2. 圍棋的勝敗至少包括兩種,一種是壓著打或是完勝,另一種是反敗為勝
AlphaGo的設計應該是循著第一條路線
問題是餵它的千萬盤訓練用人類棋譜卻包含非常多第二類棋譜
反敗為勝的棋譜應該非常多用的是勝負手(或是無理手)
不曉得這會不會是AlphaGo昨天崩潰的原因?
3. 以現在AG的能力,它應該可以先歸類/分群 將之前訓練的棋譜分開
重新訓練時只採用第一種壓著打或是完勝的棋譜
也許就不會有無理手的出現了 (或數學上 讓它的系統參數穩定)