今天第四戰李世石下出了神之一手挖取得了勝利
假設 AlphaGo 可能的弱點就在於沒有繼續 reinforcement training 的狀態下
對於一樣的棋局可能會有一樣的反應
是不是第五戰只要下得跟今天一模一樣就會贏了?
因為就算把今天的棋局也讓它學習進去,也不過就是幾千萬盤中的一盤而已
如果沒有特別的演算法加強今天這盤的權重,對於判斷勝率的參數影響應該是微乎其微
像今天第四戰李世石開頭採取跟第二盤一樣的開局, AlphaGo 也是照下
但是李世石在第12手先變招了, 就不曉得 AlphaGo 是不是會對一樣的棋局下一樣的棋
如果是的話, 那人類打贏 AlphaGo 的最後大絕招可能就是 S/L 大法?