Re: [好文推薦] 這兩盤棋 沒人會比李世石做得好

作者: raiderho (冷顏冷雨)   2016-03-11 19:23:13
依本文說法,AlphaGo的臭棋 (人類認定) 有三種可能性,而且都已經發生了:
其一,在電腦判定的獲勝機率已經非常高時,
不同下法對機率的影響會鈍化,可能只是99.9%與99.91%的差別而已,
而算法設計可能會讓非最佳解更容易被隨機挑到。
這種非最佳解,就是真正的臭棋 (邏輯上為嚴格劣勢策略)。
然而,若以上敘述為真,當電腦下出明顯臭棋時,電腦應該已經大幅佔優了。
相反的,情勢還在膠著時,下錯會讓獲勝機率大幅降低,
臭棋被挑中的機率近乎為零,這時,我們會看到非常緊繃的對局。
這一點呼應「遇強則強,遇弱則弱」。
(最後一句不是指李和樊的差距,因為電腦棋力這幾個月增加不少);
其二,電腦傾向簡化盤面,這樣可以捨棄一些搜尋樹,
但是每棵樹可以搜尋得更深,如此,確保了獲勝機率夠大也夠準:
放棄潛在的最優解,而專注於目標(獲勝)的可達性。
反映在棋面上,就是風格明朗,有時候笨笨的,但是很難說錯;
其三,電腦對大勢的考量超乎現階段人類的極致,換子整形都極有效率,
看似魯莽骨子裏卻極為精確凶悍。這種大智若愚是人類難以理解也難以琢磨的。
由於人類目前能系統建構知識的方式還是屬於還原論模式,
所以這種整體性的估量方法 (若無人機合一) 將是難以跨過的鴻溝。
作者: TaiwanUp (以運動為本的道路環境)   2016-03-11 19:25:00
2跟3是不是一樣的意思
作者: a3831038 (哭哭傑)   2016-03-11 19:28:00
柯潔柯潔得第一
作者: raiderho (冷顏冷雨)   2016-03-11 19:31:00
不一樣。二是簡化演算法,三是機器學習能獲得一些精確的整體性衡量方式,而那時人腦無法採用的。人類的確有一些整體性的盤面直覺,但是運作不同,也不精確
作者: wadashi1 (阿拉丁)   2016-03-11 19:34:00
我覺得這樣的場景..應該不久了就會有了,不會到一兩年後!
作者: raiderho (冷顏冷雨)   2016-03-11 19:39:00
我寫一兩年後,是想像AlphaGo把狀況一的臭棋提前下了。若這兩三個月柯就下了,臭棋應該更晚出現
作者: chordate (封侯事在)   2016-03-11 19:48:00
作者: Herlin (性感豬豬)   2016-03-11 20:08:00
所以阿發狗是不是跟我們之前想像的電腦完全相反因為他練習了幾百幾千萬局而且統計了大量的資料他比起人類在判斷某一手會把大局帶向好或不好的方向更強(也就是人類所謂的大局觀 當然阿發狗只有搜尋樹而已)但是他在盤面還很大時 反而不一定會搜尋到局部最佳的一手在這種時候職業棋士會覺得阿發狗這棋真臭 業餘的吧 這樣?電腦變成大局觀"很難理解"的強 但反而局部細算會打勺這樣講來這阿發狗真是有個性 可能比真人還有個性...
作者: fgkor123 (n(N))   2016-03-11 20:27:00
http://zhuanlan.zhihu.com/yuandong/20607684有興趣可以看一下 fb研究類似課題的寫的
作者: hankyan919 (比奇堡樂隊)   2016-03-11 20:53:00
這篇分析的很不錯
作者: Verola (sometimes I love you)   2016-03-11 21:37:00
同感
作者: poverty (forever )   2016-03-11 21:46:00
但是真正的妙手(天才手)會出現嗎?
作者: NaoGaTsu (那歐卡茲)   2016-03-11 22:08:00
同感
作者: lwei781 (nap til morning?)   2016-03-11 23:40:00
二包括下厚
作者: blackwindy (黑色的風)   2016-03-12 00:41:00
如果是這樣的話那還可以加些方法減少臭棋發生的機會
作者: Cadd (C+)   2016-03-12 12:42:00
標題這樣講誤很大, 就算世界冠亞軍對決也不是100%勝率是人就會失誤, 失誤中又衍伸出新的對決方法這就是勝負之外的圍棋之美, 爭鬥藝術

Links booklink

Contact Us: admin [ a t ] ucptt.com