: 電腦好似還有一個問題就是落後時下出的各種大虧損無理手。當然可以理解電腦
: 的邏輯就是:這樣下你不應我就贏了所以勝率很高,但這對人類是沒用的。相對
: 於之前有人假設電腦落後會變更強因為要追回來,目前看起來反而是電腦落後就
: 走遠了,因為它的追棋方式對人類來說是毫無意義的只會讓自己越虧越多勝機越
: 渺茫。
其實如果我們假想自己是電腦,應該很容易可以理解這樣的行為。
在人的世界,當我們發現自己落後時,所用的方法可能是把局面弄的更複雜,
和對手比計算力;可能是採取守勢,等對手犯錯等等之類的。這些的前題是,
我們知道對手也是人,人在複雜的局面容易犯錯,人在慢長的棋局中很難每一
手都下的完美,可能這裡虧一點,那裡虧一點,最後就被追上了。
電腦呢?「他以為人的思考方式和他一樣」,所以,當他發現自己落後時,代
表在他所想的到的變化中,只要對手正確的回應,他都追不回來。
那他覺得對手會犯錯嗎?
1. 我想到了,為什麼他想不到
2. 如果他真的會下錯,那在每一種情況下都應該都有可能犯錯
=> 如果他每一種都有可能犯錯,那我當然下他犯錯後我得利最大的
所以我們在第四局會看到這些不可思議的棋。
換句話說,電腦並不知道「這一手很難,他可能想不到」這種事情,對於追回目
數的兩種選擇:
a) 這一手如果對手應錯了我得利 1 目
b) 這一手如果對手應錯了我得利 10 目
對人類來說,a 的難度可能遠大於 b ,所以我們下 a ,而不去下 b 。
但是這兩個選擇對電腦來說卻是 b > a ,
因為他覺得對手在 a b 兩個情況下犯錯的機率可能是差不多的。
以上是我對第四盤 87 手開始的解釋
(當然他在87手之後還是有比較正常的應手,所以這也不能完美的解釋他的行為)