Re: [情報] Google AI 打星海

作者: yamiyodare (shantotto)   2016-11-10 04:33:23
※ 引述《ousapas (komica123)》之銘言:
: https://www.youtube.com/watch?v=5iZlrBqDYPM
: Google DeepMind團隊剛剛釋出使用Deep Learning技術玩星海2畫面
: 和傳統戰略遊戲AI不同之處是
: 這個AI和人類一樣是根據目前看到的畫面做判斷
: 而不是根據遊戲內部數據
DeepMind 團隊在做出 AlphaGo 之前就已經把 Atari 遊戲都玩了一遍
大約有一半以上的遊戲可以超越人類 Pro 的水平
遠超過人類水平的像是打磚塊
https://www.youtube.com/watch?v=V1eYniJ0Rnk
這種學習方法特殊的地方在於直接把畫面丟進去學, 而且不需有人類指導.
以打磚塊來說, 一開始是隨機移動, 之後反饋分數強化類神經網路連結.
AI 不知道甚麼是磚塊, 甚麼是球, 甚麼是板子, 也不知道要去接球.
它只知道在某種畫面下應該下某個指令 (讓板子往左或右) 很可能會提高分數.
當 AI 不停地玩, 看過的畫面越多, 越知道要怎麼反應.
神奇的地方在於訓練幾個小時之後, AI 知道開出一條隧道可以有效提高分數.
沒有人教它, 這是它不斷嘗試各種移動方式後自己 "想" 出來的.
圍棋變化太多, 一開始隨機落子學習太慢, 所以 AlphaGo 先學業餘高段的棋步.
以打磚塊來說, 類似先告訴 AI 在哪些畫面下應該往哪邊動.
之後再透過自我對弈重複訓練, 變化出各式各樣的盤面 (畫面) 嘗試各種下一步,
反饋終盤的勝負讓 AI 知道下哪些地方比較可能贏, 以後盡量下那些地方.
星海的變化也是很多, 要從隨機指令開始學起恐怕也是很難.
完全隨機會經歷探測機亂逛不挖礦, 亂蓋建築物這種慘況很久一段時間.
所以我猜星海會從天梯高階 RP 開始學, 工兵會先乖乖挖礦或是探路或 all in.
4BG, 2BG 接各種一波, 裸雙, 雙 VS, 光炮快攻等 RP 有的招數會先拿出來嘗試.
透過自我對練瞭各種戰術對應的方式衍生各種變化, 最後也會出現沒看過的戰術.
星海有個跟圍棋差異很大的地方是因為有戰爭迷霧無法獲得完全資訊.
這也可能是 DeepMind 為什麼選擇它來挑戰的原因.
作者: wyiwyi (紙片宅)   2016-11-10 07:22:00
我覺得阿法狗比較適合打英雄聯隊....
作者: Adonisy (堂本瓜一)   2016-11-10 09:21:00
其實天梯上沒人的現象可以用阿法狗撐給人場
作者: kuoll (kuoll)   2016-11-10 09:51:00
以上次圍棋的經驗 Alphago對決一人就需要龐大的硬體資源恐怕無法負擔天梯的人數
作者: Adonisy (堂本瓜一)   2016-11-10 09:54:00
其實星海原本的電腦AI訓練他們回垃圾話就好了...
作者: lovinlover (Lovin Lover)   2016-11-10 10:28:00
只要不是極致條件下 AlphaGO用不了龐大資源AlphaGO自己對弈一天可以上千盤 運算上不是問題
作者: Pony5566 (Luna Akbar)   2016-11-10 11:11:00
阿法狗不是有分連機版跟單機版?
作者: win4104 (BB)   2016-11-10 11:44:00
說不定多人對戰其實已經偷偷混了幾盤 AlphaGO用來採樣 只是一般人分不出來(?然後等實驗結束才告訴你 這ID其實是 AI 把你打爆的不是人
作者: dispatchadv (ArtJobs)   2016-11-10 21:51:00
我有時候想那些秒退 or 60秒退的天梯對手是否是bot
作者: peacedove (林帛亨加油!!!)   2016-11-11 10:37:00
如果天梯上用最強的alphago,應該一下就沒人要打天梯了
作者: ben1357956 (QQ雞腿)   2016-11-11 12:24:00
等很久啦什麼時候要pk
作者: APM99 (血統純正台北人)   2016-11-11 12:28:00
阿法狗不會影響天梯 又不是高端整天去玩青銅號打到大師
作者: iwinlottery (我中樂透頭彩)   2016-11-11 14:51:00
Alpha go人類開場就一兩隻工兵極限抄對手家有機會嗎

Links booklink

Contact Us: admin [ a t ] ucptt.com