Re: [閒聊] Master已經突破人類圍棋運算的極限了嗎? a127 PTT批踢踢實業坊

Re: [閒聊] Master已經突破人類圍棋運算的極限了嗎?

作者: a127 (毛蘿蔔) 2017-01-05 12:42:20

※ 引述《Emerson158 (紅豆 X 八嘎 X 烏魯賽)》之銘言：
: 文章中如此寫道
: 雖知道早有AI戰倒人類高手群的一天, 自從AlphaGo驚艷表現開始
: 只是沒想到這麼快
: 下一步真的要挑戰星海爭霸了嗎?
: 這是即時戰略,感覺有點恐怖啊..
個人只是看過一些簡報介紹，
但我覺得阿發狗的壓倒性實力應該沒那麼絕望才對。
以前西洋棋被電腦演算直接暴力破解，
原因在於合法步少，對手的下一手反制只有2X步可能，
圍棋的合法步多，前幾手對手的反制有200步以上的可能。
然後西洋棋的好步就是成功的殺死對手的棋子+國王，
圍棋的好步眾說紛紜，就連佈局來說不同的棋手就有各自不同的審美觀。
雖然人類已經神乎其技的知道自己的佈局在爭奪N個目的地，
但兩個不同的N相比起來，還是會很微妙的難以判斷哪方優劣。
所以圍棋比賽沒有足夠時間被暴力破解，
於是就變成阿發狗利用評價網路來建立圍棋的審美觀，
也就是把人類棋手應對的"好步"記起來，
利用這些好步跟有限的計算來擊倒對手。
原本我在想既然餵養阿發狗的食物來源也是人類創造的，
那麼阿發狗為什麼會這麼容易的擊敗世界頂尖的好手呢?
我在猜測其實職業棋手一場比賽其實"好步"的數量沒那麼多，
相較阿發狗則是利用他的評價網路希望他每一手都是好步(但可能也是部分而已)
會有這種猜測是這五十場勝利之中，其實有幾場是幾目的勝負，
而且都是在前中期阿發狗被評論大幅領先，在後面被人類追上。
我認為會有這種異常狀況出現，可能在於一部分的賽局都以投子結束，
等於在最後收官階段給阿發狗餵養的資料不夠多，
因此目前人類在後期的計算跟審美仍然略優於阿發狗的關係。

作者: flysonics (飛音) 2017-01-05 12:45:00

AI如果要架構在RTS上面的話應該一開始只能先做快攻吧不然到了後期兵一多又是即時的 NN應該是來不及算就算他是用另一個策略weighting也一樣

作者: intela60474 (Alber) 2017-01-05 12:46:00

兩隻阿發狗無限對弈就沒有你說的問題

作者: WindSpread (陽だまりの詩) 2017-01-05 12:47:00

聽說master版本的alphago訓練時用的棋譜全是自己跟自

作者: intela60474 (Alber) 2017-01-05 12:47:00

不用怕來不及算參數訓練好後面只是代入解數學

作者: tsubasawolfy (悠久の翼) 2017-01-05 12:47:00

他平常就自己跟自己下了...去年的資料不是都有說

作者: xxxxae86 (éžæ´²å¤§è‰åŽŸ) 2017-01-05 12:47:00

他們一定做過像樓上說的事情

作者: Aatrox (the Darkin Blade) 2017-01-05 12:47:00

你講的是舊版狗新版狗完全沒看人類棋譜

作者: flysonics (飛音) 2017-01-05 12:48:00

評價網路還是要即時算勝率啊

作者: xxxxae86 (éžæ´²å¤§è‰åŽŸ) 2017-01-05 12:48:00

結果還是要找人來debug你就知道跟人類對弈才是下一步的重點

作者: flysonics (飛音) 2017-01-05 12:49:00

NN只是拿來學習強者棋手的好步而已

作者: intela60474 (Alber) 2017-01-05 12:49:00

人類後期能拉回應該是因為前期資訊對人類來說不足NN太粗糙 1萬層NN來訓練差不多

作者: flysonics (飛音) 2017-01-05 12:50:00

一個拿AI來練蠱的概念wwww

作者: intela60474 (Alber) 2017-01-05 12:52:00

一萬層是隨口說說總之是要多層 =深度學習

作者: sarevork (蚰梜黎h郎) 2017-01-05 12:53:00

正常來說是越來越絕望因為人會累XDDDDDD

作者: flysonics (飛音) 2017-01-05 12:53:00

....NN一直都沒有人只玩一層的你去看NN的paper

作者: intela60474 (Alber) 2017-01-05 12:54:00

應該說AI每下一盤就會變強一點

作者: flysonics (飛音) 2017-01-05 12:54:00

會改深度學習這個名詞一來是weighting的方式有經過簡化二來是他們說paper只要掛NN就會被當垃圾只好換個名詞

作者: a1s2d342001 (風吹褲子飛) 2017-01-05 12:56:00

機器一天下的數量就比人一生還多了

作者: meredith001 (ああああ￣▽￣) 2017-01-05 12:56:00

原來如此那賭神開示過了先用500局來欺騙電腦

作者: intela60474 (Alber) 2017-01-05 12:57:00

500局在訓練資料裡佔的比重微乎其微我們在這裡推文的當下已經不知道訓練幾局去了

作者: sarevork (蚰梜黎h郎) 2017-01-05 12:59:00

大概一個月的封閉對弈等於50年的人類對弈吧

作者: henry1234562 (äº¨åˆ©äºŒåä¸‰) 2017-01-05 13:08:00

這篇最大錯誤是認為贏得目數少是ai經驗少ai只有贏和輸沒有贏多跟贏少當一步棋會讓他從80%贏20目變90%贏半目 ai就會走這也是為什麼一堆選手中盤認輸當他看到ai處處退讓自己算一算就知道剩下怎麼樣都輸定了也就是 ai後面讓你追是因為你追了還是輸

作者: a774532087 (髒灰色去勢) 2017-01-05 13:20:00

推henry大的論點

作者: f222051618 ( 珍珠奶茶 ) 2017-01-05 13:20:00

樓樓上突破我盲點了

作者: shintz (Snow halation) 2017-01-05 13:36:00

AI:來追我阿阿哈哈哈~~

作者: suhorng ( ) 2017-01-05 13:38:00

AlphaGo 跟自己對弈的場數超級多啊XD

作者: joy3252355 (九月 ~*) 2017-01-05 13:42:00

只有我覺得這篇原po有錯誤認知嗎 ???

作者: oldriver (oldriver) 2017-01-05 13:48:00

alphago都開影分身對打練經驗值人類已經不重要啦

作者: fei6409 (fei6409) 2017-01-05 13:58:00

最後一段看來是搞錯什麼了 XD

不是只有你認為這篇錯的很多

作者: shinwind (風) 2017-01-05 14:10:00

這篇就是標準人類的觀點.就連學習這件事情上都是

作者: s101881 (PIBAO) 2017-01-05 14:38:00

這篇不對吧

作者: gmoz ( This can't do that. ) 2017-01-05 15:17:00

....

作者: tiefblau (tiefblau) 2017-01-05 16:33:00

只看過一些簡報就不要出來丟臉

作者: coldfirecf (66%的懊悔) 2017-01-05 18:22:00

完全搞錯原理的不要丟臉

作者: gy3310 2017-01-05 21:39:00

搞錯太多了

繼續閱讀

Re: [閒聊] 動畫瘋新上架偶像大師灰姑娘女孩WOODOM [問題] Nico新版介面如何看日文留言StarTouching [討論] 阿法狗和未來shinwind Re: [閒聊] 設定上詠唱時間過長的攻擊技Senkanseiki Re: [閒聊] 動畫瘋新上架偶像大師灰姑娘女孩MayBeSoft Re: [閒聊] master會召喚出誰（有聖杯雷e04a8678 [閒聊] 加速世界要怎樣才能超越刀劍神遇WOODOM Re: [閒聊] 要世界末日了，該怎麼處置心愛的人?mykey8585 [閒聊] 要世界末日了，該怎麼處置心愛的人?SuperSg [閒聊] 百樂魔擦鋼珠筆Xavy

はじめてのドクハラ健康診断変態医師のスケベ検診に悔しくもガクガク声我慢イキするOL 恋渕ももな（24）

ボーイッシュでイケメンな女友達に「おっぱいが大きくなってるか揉んでみて？」と言われて、そこから会うたびにおっぱいチェックすることになった…柴崎はる

女学生休み時間早イキディルドオナニー5 失禁潮吹きアクメver.

毎日、朝のゴミ出し時間にすれ違う隙だらけ浮きブラ女子大生をその場で即ハメ夢乃あいか

この後、このデカ乳オンナに肉棒ブチ込み激突きしまくった！マンション隣に住んでる若い女が俺のオナニー専用チ●ポにハマるまでの話安達夕莉