※ 引述《HeterCompute (異質運算)》之銘言:
: https://deepmind.com/research/alphago/alphago-vs-alphago-self-play-games/
: AlphaGo說每天都會更新10盤新的自我對戰。
: PS:一開始點進去第一盤好像會有bug不能按,
: 要看的話請自己點一下其它盤再點回來第一盤。
: PS2:10盤有8盤黑棋爆炸,看來貼目7.5太多了XD
看野狐職棋講前三盤,大致就是一直說看不懂:D
如果說真要從AI學些甚麼,大概主要在佈局階段吧。模擬出來的結果
讓人知道不同佈局下哪邊才是最大的大場。
用這角度思考很好理解為什麼AI通常不會把人類定石下完,因為定石
的每步交換都是只看"區域"的兩分而較少考慮全局,而每步價值可能
是遞減的,比方說佔空角可能價值20目,掛角可能值15目,再下一步
可能只剩10目,所以AI可能掛完就手拔了,因為外面有更大的點(AI
理解為勝率更高)
再來就是不同局面下先手價值多大或甚麼時候可以手拔也是可以跟AI
學習判斷的。不管AI互下或跟人下的譜常常就是一直手拔,有時做些
區域被認為損目的交換就是為了搶先手。這次覺得柯潔很厲害的點就
是三盤似乎都不像上次李世石那麼被動,他很努力在各種情勢中設法
脫先,避免局勢完全被電腦帶著走,但可惜實力有差距
想想真要對人類學棋更有意義的話可能還是要人類和AI對弈。從AI邏
輯來想,他的勝負手或官子都和人類理解的最佳下法有差異,而且對
人下棋的邏輯來說是沒甚麼幫助的。比方說收官吧,人類落後時仍會
下最佳解(最大官子)等待機會,但對AI來說他早就預見這樣收必敗,
勝率很低。所以AI互下時落後方AI的選點可能是人類一看明顯沒棋又
損目的送菜(對AI來說送菜的點可能他模擬時才有勝機),而領先方AI
可能判斷大優勢所以一直退讓也一樣在損目,這種時候兩邊都不是下
最佳解,那自然就不一定值得學
這次放出的AI對奕譜大概都是挑過的,猜測應該都是挑選全盤兩方估
計勝率維持相近或是有勝率倒轉的才較有可看性。不然很多AI對奕的
譜應該是一面倒,落後方不斷用無理手測試然後越虧越多勝率不斷被
拉開後投子