Re: [閒聊] AI打星海爭霸,後來如何?

作者: kuoyipong (petohtalrayn)   2022-08-30 17:55:46
: 大家可以看 2:10:16 開始的部分 https://youtu.be/cUTMhmVh1qs?t=7816
: 這時候AlphaStar有一大票追獵者,看起來非常兇悍。
: 但 Mana 只要用稜鏡把部隊運到對方家裡騷擾,AlphaStar的大軍就會班師回朝
: 戰鬥上 AlphaStar 只有「大部隊集結抗衡敵人」的概念
: 同時,AlphaStar 策略上也不太屌兵種對抗優劣,從頭至尾貫徹「追獵者最棒!」
: 這個大家在猜是因為AlphaStar覺得這兵種在消耗上最有效率
: 然後面對 Mana 的 不朽+破壞能 大軍,AlphaStar一樣用追獵者上去對幹。
: 想當然爾當然是輸了 從人類的角度看起來這兵種對抗要贏實在太難了
我覺得這部分當然應該是訓練給的APM相關參數有問題
也就是說給AI的APM上限還是太高,導致AI可以靠操作硬幹
我個人的推測是AI對局那個兩百年數據量,不太可能沒有用到不朽
那如果數據裡面有不朽結果還是敢用追獵硬推,而且確實也給他推成功了
那簡單來說就是這種微操無敵的兵種對AI來說太強
強到一般人類理解的優劣跟AI對局時的優劣是不同的
其實個人覺得星海一部分的問題在這裡
有沒有微操的情況下兵種強度存在差異
微操算是職業選手的基本功
雖然AI做出來的微操有點太離譜,但其實在一般人眼中選手的微操也很離譜
而重點是-不同微操能力下兵種克制的狀態也不同
就像一般人而言被毒爆衝生化會被換的很傷
但對選手而言,傷不傷取決於你散兵的能力
因此同理,對AI而言
如果部隊交戰時的微操對對局的影響大於你運營、策略、兵種克制的影響
那AI就會傾向於在部隊交戰時微操最大化
那就會回歸上面那個前提-APM設定太高導致兵種克制的概念與人類不同
某程度確實算是訓練失敗,因為前提與人類有明顯差距
但可以5:0可能代表在AI那個APM之下,閃追幹正面是局部最佳解
就跟人類以前找出來的三不朽等局部最佳解類似
: 當然你可以說結果就是 4:1 ,AlphaStar屌虐。
: 但我同時也相信那個時間點找其他人類高手跟AlphaStar打,
: AlphaStar的贏面應該是很低。因為策略認知上的缺陷被Mana暴露出來了
我是覺得AI的策略有時候是這樣
AI的局部最佳解不一定跟人類的局部最佳解一樣
而星海這個遊戲的微操會大幅影響遊戲的特質
讓AI只要在操作上設定的不夠貼近人類,那他得到的答案就會跟人類差距很大
以前圍棋沒有所謂的微操問題
具體來說只有每一步有多少思考時間的差別
但星海爭霸這款微操會影響策略的遊戲
這次AI讓人不服氣的點是交戰時APM過高導致兵種克制與我們認知的差距太大
但其實AI下棋的時候也有類似的狀況
很多職業棋手看到AI的下法都會困惑,更會直接建議初學者不要學AI的下法
因為AI的策略不會告訴你他的邏輯是什麼
所以直接說AI的策略有問題可能只是人類的一廂情願
因為可能在AI的領域中,那個策略問題都是可以解決的
也因此回到前面的部分,你要為AI設下多少限制才「公平」
這次是閃追獵的操作上限太高,職業選手也做不到這個上限
所以變成騎摩托車跑一百公尺那種感覺
但是AI的自我對局中,大家(自己跟自己的分身)都是騎摩托車的
所以策略都是基於騎摩托車來發展
不過似乎這計畫沒有要繼續做下去
所以也很難看到AI再壓低APM之後的策略轉變了
作者: tonyy801101 (tonyy801101)   2022-08-30 17:58:00
手速太高基本上不是跟AI打,是跟外掛打那個人類也做不到的操作基本上就是不公平的存在
作者: lsd25968 (cookie)   2022-08-30 18:00:00
是說AI是不是情蒐都做得很到位? 大招有用嗎XD 雖然我想大招成功幾次後 AI懂得怎麼防了就沒用了
作者: hh123yaya (KID)   2022-08-30 18:01:00
情蒐也是要犧牲單位去巡邏才有 AI有養成嗎?不管有沒有情蒐都閃追幹死你的話 也沒必要情蒐了
作者: arrenwu (鍵盤的戰鬼)   2022-08-30 18:01:00
@lsd25968 你講的這種思考方式是人類的思考方式
作者: goliath   2022-08-30 18:01:00
早期搞人的手段 微操好可以解決七八成吧
作者: Senkanseiki (戦艦棲姫)   2022-08-30 18:02:00
問題是高手速前提下大招可能都不是大招,我記得之前AI被先知搞結果損失都是微乎其微
作者: arrenwu (鍵盤的戰鬼)   2022-08-30 18:02:00
另外關於APM的部分,我沒有相關證據,但我自己認為APM會設定成我們看到的那種高度很可能是因為如果不這樣設定AlphaStar可能沒辦法訓練到能拿出來DEMO的程度
作者: LeeXX (理性 但不一定中立)   2022-08-30 18:03:00
同意在ai的apm下 會有和人類玩家不同的meta
作者: arrenwu (鍵盤的戰鬼)   2022-08-30 18:03:00
至少我覺得沒啥道理他如果 APM 150就能打贏人類他會需要給到 300 APM畢竟這項實驗,APM設定越低 結果的價值就越高
作者: LeeXX (理性 但不一定中立)   2022-08-30 18:05:00
這也是RTS對遊戲公司而言為難的地方 最早期人族打針高階玩家無敵中低階就是被滾爛燒爛 沒有一個平衡性是能高低階環境兼顧的
作者: goliath   2022-08-30 18:05:00
畢竟實驗結果是跟你說AI和人的apm操作結果不同了
作者: tasin (Ringo)   2022-08-30 18:05:00
選手的微操不會在一般人眼中離譜啊 做不到而已 ai那個叫肉眼看就知道人類做不到
作者: LeeXX (理性 但不一定中立)   2022-08-30 18:07:00
不不選手的操作看起來也一點都不像人類啊 每個都像有四隻手 屏幕一秒刷一次的
作者: cycy771489 (曾經的信徒)   2022-08-30 18:08:00
取消戰爭迷霧,AI還會選擇爆單一兵種嗎?
作者: LeeXX (理性 但不一定中立)   2022-08-30 18:08:00
而且像parting也有打過完全無損閃追操作贏下一局 那也是很非人類
作者: arrenwu (鍵盤的戰鬼)   2022-08-30 18:08:00
取消戰爭迷霧那玩的就不是星海爭霸了
作者: hh123yaya (KID)   2022-08-30 18:09:00
其實這也牽扯到遊戲本身平衡的方向了 兵種的操作性本來就在平衡的考量中
作者: cycy771489 (曾經的信徒)   2022-08-30 18:10:00
先讓他學習
作者: jeeyi345 (letmein)   2022-08-30 18:10:00
本來想看策略 結果AI覺得微操就夠了
作者: Senkanseiki (戦艦棲姫)   2022-08-30 18:11:00
問題是這其實不是這種AI的訓練方式
作者: arrenwu (鍵盤的戰鬼)   2022-08-30 18:12:00
是啊 你不能想像他是個人類XD
作者: LeeXX (理性 但不一定中立)   2022-08-30 18:12:00
當初會選星海來訓練就是因為不像圍棋,星海有迷霧吧
作者: arrenwu (鍵盤的戰鬼)   2022-08-30 18:13:00
我聽到的也是想嘗試看看RL下AI在非全知遊戲下的表現
作者: jeeyi345 (letmein)   2022-08-30 18:15:00
不然回去比非即時呢
作者: LeeXX (理性 但不一定中立)   2022-08-30 18:15:00
回到職業選手 先不管地圖快捷 一般大後期為了閃AOE和方便施法 加上要顧後方 控制群組至少要6、7個時時緊盯 這你覺得是人類幹得出來的事?
作者: NoLimination (啊啊啊啊)   2022-08-30 18:15:00
結果AI:戰爭迷霧?閃現追獵能解決一切問題
作者: LeeXX (理性 但不一定中立)   2022-08-30 18:16:00
非即時到alphago養好就已經不用再比啦
作者: goliath   2022-08-30 18:16:00
按鍵太多 手就開始跟不上腦袋了 AI可沒這個問題
作者: arrenwu (鍵盤的戰鬼)   2022-08-30 18:18:00
另外,策略認知有無問題是結果論。不是說AI在模擬環境覺得這是最佳解那就正確
作者: LeeXX (理性 但不一定中立)   2022-08-30 18:21:00
職業選手恐怖就在那些按鍵腦袋和手都能處理 而且是非公式化的應對 至少在serral碾壓的時候是這麼一回事 歐美的大後期靈活打法更勝韓國的公式化打法
作者: tasin (Ringo)   2022-08-30 18:28:00
Serral明明是個完美呈現公式化應對到極致的玩家XD 所以他最不會打ZVZ這種主動的對抗
作者: chang1248w (彩棠)   2022-08-30 18:32:00
要說準備戰術不得不提bo無敵的男人rogue看他打zvz根本藝術
作者: KuBiLife (人生苦逼)   2022-08-30 18:35:00
就AI發現剪刀石頭布裡面石頭其實是手榴彈他學怎麼丟手榴彈就好 管他剪刀跟布
作者: black80731 (壞壞)   2022-08-30 18:40:00
之前有 沒限制的 影片ai的可以 把部隊散開 閃aoe 太扯
作者: kuoyipong (petohtalrayn)   2022-08-30 18:42:00
AlphaStar有限制,但看來限制太寬鬆導致AS得到的結果就是閃追OP然後鳳凰強無敵
作者: Minesweeper (lleh)   2022-08-30 18:44:00
沒限制不就跟悍馬一樣,有意義嗎
作者: kluele585 (漆黑烈焰大魔法師)   2022-08-30 18:55:00
事實上你指的 人類不知道AI這麼做的原因是什麼<—這點這幾年一直是研究的方向之一 以圍棋舉例好了 現在的AI已經能告訴你出這步棋他為什麼這麼下 好是好在哪裡 甚至人類下一手也能分析出勝率跟優劣
作者: Minesweeper (lleh)   2022-08-30 19:32:00
看勝率本來就可以了吧,能夠自解釋倒是聞所未聞,哪家的圍棋ai?要解釋這一手好在哪,是什麼解釋法?
作者: pleaseask (請問)   2022-08-30 19:46:00
ai自練,可能因為總是在找最佳化策略(而非針對所有策略的應對模式),最終的答案就是閃追互打,打了幾千萬局之後就只是一直優化這個策略,人類出奇招(甚至只是很普通的偷家)就會讓ai整個錯愕然後失常
作者: kuoyipong (petohtalrayn)   2022-08-30 20:01:00
其實奇招是有考慮的而且結論就是,你就算奇招還是打不贏我閃追(遠目)至少這五場閃追都是強到超乎人類所知的策略
作者: km850105 (赤月之雙子)   2022-08-30 20:09:00
阿法星當初去打天梯也被養壞,被三族各路大招快攻搞到只會大召然後韓國的星海風和歐洲完全不同,想搞出kespa鼎盛期韓國的大將級選手機乎不可能

Links booklink

Contact Us: admin [ a t ] ucptt.com