AI 真「即時生成」遊戲了!Google 發布 GameNGen 引擎作出原創《Doom》
https://www.inside.com.tw/article/36060-doom-real-time
Google Research 的科學家團隊與特拉維夫大學的研究人員近日發表了一項創新研究成果,
基於人工智能的遊戲引擎 GameNGen。該系統能夠利用神經網路即時生成原創的《毀滅戰士
》(Doom) 遊戲畫面。
研究團隊由 Dani Valevski、Yaniv Leviathan、Moab Arar 和 Shlomi Fruchter 組成。他
們運用 Stable Diffusion 技術,設計了 GameNGen 系統。該系統透過處理前幾幀畫面和玩
家即時的輸入,生成新的遊戲畫面,展現出令人驚訝的視覺真實感和連貫性。
GameNGen 的特色是能夠生成具有一致邏輯的完整遊戲引擎。玩家可以像玩真正的遊戲一樣
進行轉向、平移、開火等操作,同時系統會即時建構遊戲關卡。據研究報告顯示,引擎能以
每秒 20 格的速度在單張 TPU 上生成高品質的遊戲畫面,短片段甚至難以與真實的《毀滅
戰士》遊戲畫面區分。
GameNGen 的核心技術在於使用擴散模型 (diffusion model) 來預測每一格遊戲畫面。研究
團隊首先訓練了一個強化學習 (RL) 代理來玩遊戲並記錄其行為,然後用這些數據訓練擴散
模型,使其能夠根據過去的畫面序列和動作預測下一格畫面。這種方法使模型能夠模擬複雜
的遊戲狀態更新,如管理生命值和彈藥、攻擊敵人以及與環境互動等。
為了獲得足夠的訓練數據,Google 團隊訓練了 AI 代理在不同難度下玩《毀滅戰士》, 模
擬各種玩家技術水準。系統會獎勵收集道具、完成關卡等行為,同時懲罰受傷或死亡,來創
造出能夠遊玩《毀滅戰士》的 AI 代理,為 GameNGen 模型提供了數百小時的視覺訓練數據
。
研究人員還解決了 Stable Diffusion 在長時間生成連續畫面時可能出現的連貫性問題。他
們採用了更長的連續用戶輸入紀錄和前置畫面來訓練新畫面,並使用高斯雜訊對這些參考畫
面進行處理。這種做法確保畫面能自我修正以及長時間的畫面穩定。
《毀滅戰士》自 1993 年發布以來一直是各種技術基準的代表,如今它再次推動了 AI 在即
時生成複雜互動環境的能力邊界。GameNGen 的開發可能會對全球 2000 億美元的遊戲產業
產生重大影響,降低開發時間和成本,使遊戲創作更加普及,並催生新型的動態演化遊戲類
型。
儘管 GameNGen 生成的遊戲畫面仍有一些瑕疵,如隨機出現的模糊區域、閃爍的界面元素等
,但作為一個技術展示,它顯現了 AI 在遊戲開發領域的巨大潛力。結合加州理工學院利用
《我的世界》教導 AI 模型生成一致地圖的研究,基於 AI 的遊戲引擎可能比我們想像的更
快進入實際應用階段。然而,GameNGen 對於現代圖形密集型遊戲,系統需要強大的計算能
力,而目前該技術僅針對《毀滅戰士》進行了優化,開發通用型 AI 遊戲引擎仍存在難度。
展望未來,我們可能會看到由 AI 創造和驅動的遊戲,這些遊戲能夠根據玩家的行為即時調
整並生成內容。