Re: [閒聊] Master已經突破人類圍棋運算的極限了嗎?

作者: a127 (毛蘿蔔)   2017-01-05 12:42:20
※ 引述《Emerson158 (紅豆 X 八嘎 X 烏魯賽)》之銘言:
: 文章中如此寫道
: 雖知道早有AI戰倒人類高手群的一天, 自從AlphaGo驚艷表現開始
: 只是沒想到這麼快
: 下一步真的要挑戰星海爭霸了嗎?
: 這是即時戰略,感覺有點恐怖啊..
個人只是看過一些簡報介紹,
但我覺得阿發狗的壓倒性實力應該沒那麼絕望才對。
以前西洋棋被電腦演算直接暴力破解,
原因在於合法步少,對手的下一手反制只有2X步可能,
圍棋的合法步多,前幾手對手的反制有200步以上的可能。
然後西洋棋的好步就是成功的殺死對手的棋子+國王,
圍棋的好步眾說紛紜,就連佈局來說不同的棋手就有各自不同的審美觀。
雖然人類已經神乎其技的知道自己的佈局在爭奪N個目的地,
但兩個不同的N相比起來,還是會很微妙的難以判斷哪方優劣。
所以圍棋比賽沒有足夠時間被暴力破解,
於是就變成阿發狗利用評價網路來建立圍棋的審美觀,
也就是把人類棋手應對的"好步"記起來,
利用這些好步跟有限的計算來擊倒對手。
原本我在想既然餵養阿發狗的食物來源也是人類創造的,
那麼阿發狗為什麼會這麼容易的擊敗世界頂尖的好手呢?
我在猜測其實職業棋手一場比賽其實"好步"的數量沒那麼多,
相較阿發狗則是利用他的評價網路希望他每一手都是好步(但可能也是部分而已)
會有這種猜測是這五十場勝利之中,其實有幾場是幾目的勝負,
而且都是在前中期阿發狗被評論大幅領先,在後面被人類追上。
我認為會有這種異常狀況出現,可能在於一部分的賽局都以投子結束,
等於在最後收官階段給阿發狗餵養的資料不夠多,
因此目前人類在後期的計算跟審美仍然略優於阿發狗的關係。
作者: flysonics (飛音)   2017-01-05 12:45:00
AI如果要架構在RTS上面的話 應該一開始只能先做快攻吧不然到了後期兵一多又是即時的 NN應該是來不及算 就算他是用另一個策略weighting也一樣
作者: intela60474 (Alber)   2017-01-05 12:46:00
兩隻阿發狗無限對弈 就沒有你說的問題
作者: WindSpread (陽だまりの詩)   2017-01-05 12:47:00
聽說master版本的alphago訓練時用的棋譜全是自己跟自
作者: intela60474 (Alber)   2017-01-05 12:47:00
不用怕來不及算 參數訓練好後面只是代入解數學
作者: tsubasawolfy (悠久の翼)   2017-01-05 12:47:00
他平常就自己跟自己下了...去年的資料不是都有說
作者: xxxxae86 (非洲大草原)   2017-01-05 12:47:00
他們一定做過像樓上說的事情
作者: Aatrox (the Darkin Blade)   2017-01-05 12:47:00
你講的是舊版狗 新版狗完全沒看人類棋譜
作者: flysonics (飛音)   2017-01-05 12:48:00
評價網路還是要即時算勝率啊
作者: xxxxae86 (非洲大草原)   2017-01-05 12:48:00
結果還是要找人來debug你就知道跟人類對弈才是下一步的重點
作者: flysonics (飛音)   2017-01-05 12:49:00
NN只是拿來學習強者棋手的好步而已
作者: intela60474 (Alber)   2017-01-05 12:49:00
人類後期能拉回應該是因為前期資訊對人類來說不足NN太粗糙 1萬層NN來訓練差不多
作者: flysonics (飛音)   2017-01-05 12:50:00
一個拿AI來練蠱的概念wwww
作者: intela60474 (Alber)   2017-01-05 12:52:00
一萬層是隨口說說 總之是要多層 =深度學習
作者: sarevork (蚰梜黎h郎)   2017-01-05 12:53:00
正常來說是越來越絕望 因為人會累XDDDDDD
作者: flysonics (飛音)   2017-01-05 12:53:00
....NN一直都沒有人只玩一層的 你去看NN的paper
作者: intela60474 (Alber)   2017-01-05 12:54:00
應該說AI每下一盤就會變強一點
作者: flysonics (飛音)   2017-01-05 12:54:00
會改深度學習這個名詞一來是weighting的方式有經過簡化二來是他們說paper只要掛NN就會被當垃圾 只好換個名詞
作者: a1s2d342001 (風吹褲子飛)   2017-01-05 12:56:00
機器一天下的數量就比人一生還多了
作者: meredith001 (ああああ ̄▽ ̄)   2017-01-05 12:56:00
原來如此 那賭神開示過了 先用500局來欺騙電腦
作者: intela60474 (Alber)   2017-01-05 12:57:00
500局在訓練資料裡佔的比重微乎其微我們在這裡推文的當下 已經不知道訓練幾局去了
作者: sarevork (蚰梜黎h郎)   2017-01-05 12:59:00
大概一個月的封閉對弈等於50年的人類對弈吧
作者: henry1234562 (亨利二十三)   2017-01-05 13:08:00
這篇最大錯誤是 認為贏得目數少是ai經驗少ai只有贏和輸 沒有贏多跟贏少當一步棋會讓他從80%贏20目變90%贏半目 ai就會走這也是為什麼一堆選手中盤認輸 當他看到ai處處退讓自己算一算就知道 剩下怎麼樣都輸定了也就是 ai後面讓你追 是因為你追了還是輸
作者: a774532087 (髒灰色去勢)   2017-01-05 13:20:00
推henry大的論點
作者: f222051618 ( 珍 珠 奶 茶 )   2017-01-05 13:20:00
樓樓上突破我盲點了
作者: shintz (Snow halation)   2017-01-05 13:36:00
AI:來追我阿 阿哈哈哈~~
作者: suhorng ( )   2017-01-05 13:38:00
AlphaGo 跟自己對弈的場數超級多啊XD
作者: joy3252355 (九月 ~*)   2017-01-05 13:42:00
只有我覺得這篇原po有錯誤認知嗎 ???
作者: oldriver (oldriver)   2017-01-05 13:48:00
alphago都開影分身對打練經驗值 人類已經不重要啦
作者: fei6409 (fei6409)   2017-01-05 13:58:00
最後一段看來是搞錯什麼了 XD
作者: henry1234562 (亨利二十三)   2017-01-05 14:00:00
不是只有你認為 這篇錯的很多
作者: shinwind (風)   2017-01-05 14:10:00
這篇就是標準人類的觀點.就連學習這件事情上都是
作者: s101881 (PIBAO)   2017-01-05 14:38:00
這篇不對吧
作者: gmoz ( This can't do that. )   2017-01-05 15:17:00
....
作者: tiefblau (tiefblau)   2017-01-05 16:33:00
只看過一些簡報就不要出來丟臉
作者: coldfirecf (66%的懊悔)   2017-01-05 18:22:00
完全搞錯原理的不要丟臉
作者: gy3310   2017-01-05 21:39:00
搞錯太多了

Links booklink

Contact Us: admin [ a t ] ucptt.com