※ [本文轉錄自 StarCraft 看板 #1Pa7S_4S ]
作者: H45 (!H45) 看板: StarCraft
標題: Re: [新聞] 人工智能開始玩星海爭霸 2,它玩的如何?
時間: Sun Aug 13 23:58:50 2017
論文:https://deepmind.com/documents/110/sc2le.pdf
如果AI以點擊為輸入介面的話,星海每個動作估計有10^8個可能性,相較之下,19路圍棋
每步棋最多只有19x19種可能性。
戰爭迷霧有特殊的圖形介面讓AI知道戰爭迷霧在哪裡(見論文圖2)。
APM設定成180,換算一下就是AI一秒最多只能下三道指令。
關於學習的部分,首先DM讓AI自己跟自己左右互搏,一場最多打30分鐘,超時算平手,學
到最後和內建最簡單的電腦1v1測試,AI一場也沒贏過,只有平手或輸掉兩種結果(見論文
圖5)。
之後DM讓AI去看800K個replay,這800K個replay從最低端到職業玩家都有,AI從這些
replay學習局面判斷能力。遊戲剛開始的時候,因為輸贏機率一樣,所以AI預測準確率為
50%。遊戲進行到愈後面AI準確率愈高,在遊戲時間15分鐘的時候AI有65%機率猜對最後結
果(見論文圖8)。
然後DM讓AI模仿replay裡面玩家的行為,論文最後只提到AI會去生產一些軍事單位(見論
文圖9),沒提到能不能打贏最簡單的電腦......