Re: [情報] 最新星海AI十比零血洗人類職業玩家 EvilSD PTT批踢踢實業坊

Re: [情報] 最新星海AI十比零血洗人類職業玩家

作者: EvilSD (邪星暗(Usagi)) 2019-01-25 11:07:54

持續一直有再追蹤這件事，不過這次的比賽結果
確實讓我非常驚訝
先來簡單介紹一下DeepMid是如何訓練這個AlphaStar的
https://www.youtube.com/watch?v=5iZlrBqDYPM
上面這段影片就是他們在讓AI學習的過程
一般常見的遊戲AI
都是直接讀取遊戲內部參數
然後透過寫好的腳本直接下去做執行
簡單來說就是讓AI根據不同種時間狀況作相對應的決定與抉擇
但DeepMid並不是如此，DeepMid使用的是深度學習的方式
(如今我已經很難想像他們在這次AlphaStar是如何建構深度學習網路的)
我們在回到剛剛的影片
影片上的左邊有四個畫面
這就是所謂的特徵提取的動作
也就是AlphaStar在建立模型與學習的時候
是透過即時的影像進行，而不是透過讀取遊戲參數使用腳本的方式
困難點在哪呢？
普遍現在不論是學界與工業界
大家成熟的深度學習架構（也可以說現在最常見的AI)
大多數都是讀取一個畫面內的特徵參數進行學習
如果要簡單解釋就是，今天給你一張照片上面有隻狗
那AI辨識後就說這是狗，這是所謂的Classification
照片上有隻狗還能標記出在哪裡
那就是Classification + Localization
照片上有很多種物體並且都能標記出位子
就是 Object Detection(也就是目前智慧車常用的方式)
還有另一種叫做Semantic Segmentation
是將畫面上的每一個pixel去做標記
那AlpahStar做了些什麼呢
首先在早期的API裡
裡面可以同時學習20個Semantic Segmentation
而且是即時的，所以我甚至懷疑其實是Instance Segmentation
那單純只是學習這些畫面困難點在哪呢?
時間與未知(戰爭迷霧)
因為以前的AlphaGO
圍棋的大小是一個既定19X19的範圍
所以我下完一子後，我可以全局重新判斷
但星海完全不是如此
第一　星海的地圖資訊很多是未知的，所以我們才要防空投探圖等
第二　星海的遊戲是時間連續的，也就是我上一秒鐘做的事情會影響到下一秒鐘
跟圍棋完全不一樣，不是下完一子後重新掃描全局
所以困難點非常的多，在特徵提取上大概能夠理解
但多特徵合併後進行學習，又要保持時間上學習不會誤差放大（如傳統RNN）
(傳統RNN在學習連續性資料後,往往一開始學習的資訊會遺忘或是誤差放大
因此後來才有了深度學習版本的LSTM與biLSTM)
上述的內容可能還是有點艱深難懂，但我已經盡可能講得比較簡單一些
總而言之大家現在討論的是APM 操作上的問題
但我看見的是，能透過視覺的方式
讓AI學習玩星海爭霸二
還能夠將遊戲時間拉長並且與職業選手對戰
我是覺得很不可思議
還是那種....完全無法想像他們訓練出這個模型的狀態
真的真的非常的吃驚(原本以為這至少也要五年才能夠突破的瓶頸)

作者: tsairay (火の紅寶石) 2019-01-25 11:14:00

電影描繪的未來...越來越接近了...

作者: sumarai (Pawn) 2019-01-25 11:14:00

覺得可以辦AI對AI打星海，看看誰的AI最極限

作者: reinhert (史丹佛的銀色子彈) 2019-01-25 11:14:00

那個影片已經是兩年多前的東西了，現在的AlphaStar應該不是照搬

作者: nok1126 (Nok) 2019-01-25 11:15:00

鋼鐵擂台

作者: tim32142000 (許B) 2019-01-25 11:18:00

表演賽，世界冠軍打AI

作者: elwing (鳥兒) 2019-01-25 11:19:00

Instance(個體）=/= instant(立即）好嗎？semantics segmentation=對每一個像素劃分類別 instance segmentation=不

作者: RaiGend0519 (Named RaiGend) 2019-01-25 11:19:00

以後會出現一種比賽：民間客制ＡＩ對抗客制ＡＩ

作者: jerryae86 (Justdoit_MM) 2019-01-25 11:41:00

有打贏的影片可以看嗎

作者: arrenwu (鍵盤的戰鬼) 2019-01-25 11:42:00

打贏的這場 https://youtu.be/cUTMhmVh1qs?t=9120

作者: gigayaya (gigayaya) 2019-01-25 11:44:00

網路我記得是用LSTM

作者: ARHAN (腦腦的阿賢腦腦的^.^\~/) 2019-01-25 11:46:00

攻殺虫 484不懂Semantic跟Instance差別

作者: elwing (鳥兒) 2019-01-25 11:50:00

基本上segmentation只是把分類問題和偵測問題提高到像素級別那你都知道object detection難於classification 怎麼會覺得semantics(像素級別的classificatiin) 會簡單於 instance(像素級別的object detection)呢？抱歉上面筆誤怎麼會覺得semantics難於instance

作者: vnon (路人) 2019-01-25 12:08:00

deepmind有把介紹放在他們的部落格上了，先去看看吧..

作者: ruledesign (ruledesign) 2019-01-25 13:17:00

RL吧

作者: K60258 (儲存勇氣~) 2019-01-25 13:54:00

不太懂就先研究，別急著秀呀

繼續閱讀