依本文說法,AlphaGo的臭棋 (人類認定) 有三種可能性,而且都已經發生了:
其一,在電腦判定的獲勝機率已經非常高時,
不同下法對機率的影響會鈍化,可能只是99.9%與99.91%的差別而已,
而算法設計可能會讓非最佳解更容易被隨機挑到。
這種非最佳解,就是真正的臭棋 (邏輯上為嚴格劣勢策略)。
然而,若以上敘述為真,當電腦下出明顯臭棋時,電腦應該已經大幅佔優了。
相反的,情勢還在膠著時,下錯會讓獲勝機率大幅降低,
臭棋被挑中的機率近乎為零,這時,我們會看到非常緊繃的對局。
這一點呼應「遇強則強,遇弱則弱」。
(最後一句不是指李和樊的差距,因為電腦棋力這幾個月增加不少);
其二,電腦傾向簡化盤面,這樣可以捨棄一些搜尋樹,
但是每棵樹可以搜尋得更深,如此,確保了獲勝機率夠大也夠準:
放棄潛在的最優解,而專注於目標(獲勝)的可達性。
反映在棋面上,就是風格明朗,有時候笨笨的,但是很難說錯;
其三,電腦對大勢的考量超乎現階段人類的極致,換子整形都極有效率,
看似魯莽骨子裏卻極為精確凶悍。這種大智若愚是人類難以理解也難以琢磨的。
由於人類目前能系統建構知識的方式還是屬於還原論模式,
所以這種整體性的估量方法 (若無人機合一) 將是難以跨過的鴻溝。