作者:
a127 (毛蘿蔔)
2017-01-05 12:42:20※ 引述《Emerson158 (紅豆 X 八嘎 X 烏魯賽)》之銘言:
: 文章中如此寫道
: 雖知道早有AI戰倒人類高手群的一天, 自從AlphaGo驚艷表現開始
: 只是沒想到這麼快
: 下一步真的要挑戰星海爭霸了嗎?
: 這是即時戰略,感覺有點恐怖啊..
個人只是看過一些簡報介紹,
但我覺得阿發狗的壓倒性實力應該沒那麼絕望才對。
以前西洋棋被電腦演算直接暴力破解,
原因在於合法步少,對手的下一手反制只有2X步可能,
圍棋的合法步多,前幾手對手的反制有200步以上的可能。
然後西洋棋的好步就是成功的殺死對手的棋子+國王,
圍棋的好步眾說紛紜,就連佈局來說不同的棋手就有各自不同的審美觀。
雖然人類已經神乎其技的知道自己的佈局在爭奪N個目的地,
但兩個不同的N相比起來,還是會很微妙的難以判斷哪方優劣。
所以圍棋比賽沒有足夠時間被暴力破解,
於是就變成阿發狗利用評價網路來建立圍棋的審美觀,
也就是把人類棋手應對的"好步"記起來,
利用這些好步跟有限的計算來擊倒對手。
原本我在想既然餵養阿發狗的食物來源也是人類創造的,
那麼阿發狗為什麼會這麼容易的擊敗世界頂尖的好手呢?
我在猜測其實職業棋手一場比賽其實"好步"的數量沒那麼多,
相較阿發狗則是利用他的評價網路希望他每一手都是好步(但可能也是部分而已)
會有這種猜測是這五十場勝利之中,其實有幾場是幾目的勝負,
而且都是在前中期阿發狗被評論大幅領先,在後面被人類追上。
我認為會有這種異常狀況出現,可能在於一部分的賽局都以投子結束,
等於在最後收官階段給阿發狗餵養的資料不夠多,
因此目前人類在後期的計算跟審美仍然略優於阿發狗的關係。
AI如果要架構在RTS上面的話 應該一開始只能先做快攻吧不然到了後期兵一多又是即時的 NN應該是來不及算 就算他是用另一個策略weighting也一樣
聽說master版本的alphago訓練時用的棋譜全是自己跟自
作者:
xxxxae86 (éžæ´²å¤§è‰åŽŸ)
2017-01-05 12:47:00他們一定做過像樓上說的事情
作者:
Aatrox (the Darkin Blade)
2017-01-05 12:47:00你講的是舊版狗 新版狗完全沒看人類棋譜
作者:
xxxxae86 (éžæ´²å¤§è‰åŽŸ)
2017-01-05 12:48:00結果還是要找人來debug你就知道跟人類對弈才是下一步的重點
人類後期能拉回應該是因為前期資訊對人類來說不足NN太粗糙 1萬層NN來訓練差不多
作者:
sarevork (蚰梜黎h郎)
2017-01-05 12:53:00正常來說是越來越絕望 因為人會累XDDDDDD
....NN一直都沒有人只玩一層的 你去看NN的paper
會改深度學習這個名詞一來是weighting的方式有經過簡化二來是他們說paper只要掛NN就會被當垃圾 只好換個名詞
500局在訓練資料裡佔的比重微乎其微我們在這裡推文的當下 已經不知道訓練幾局去了
作者:
sarevork (蚰梜黎h郎)
2017-01-05 12:59:00大概一個月的封閉對弈等於50年的人類對弈吧
這篇最大錯誤是 認為贏得目數少是ai經驗少ai只有贏和輸 沒有贏多跟贏少當一步棋會讓他從80%贏20目變90%贏半目 ai就會走這也是為什麼一堆選手中盤認輸 當他看到ai處處退讓自己算一算就知道 剩下怎麼樣都輸定了也就是 ai後面讓你追 是因為你追了還是輸
作者:
shintz (Snow halation)
2017-01-05 13:36:00AI:來追我阿 阿哈哈哈~~
作者:
suhorng ( )
2017-01-05 13:38:00AlphaGo 跟自己對弈的場數超級多啊XD
作者:
oldriver (oldriver)
2017-01-05 13:48:00alphago都開影分身對打練經驗值 人類已經不重要啦
作者:
fei6409 (fei6409)
2017-01-05 13:58:00最後一段看來是搞錯什麼了 XD
作者:
s101881 (PIBAO)
2017-01-05 14:38:00這篇不對吧
作者:
gmoz ( This can't do that. )
2017-01-05 15:17:00....
作者:
tiefblau (tiefblau)
2017-01-05 16:33:00只看過一些簡報就不要出來丟臉
作者: gy3310 2017-01-05 21:39:00
搞錯太多了