情報來源:https://cnet.co/2YwIZUo
Google的DeepMind正透過星海爭霸II來幫助他們訓練自動駕駛車輛
在這個時代裡,尋找新的方式來訓練神經網路已經越來越重要,尤其在許多廠商開始自動
駕駛車輛開發競賽。因此,有些開發者試圖發明嶄新的訓練方式來提升他們的神經網路訓
練效率,使用《星海爭霸II》就是其中之一。
你可能會想,一款近十年的老遊戲怎麼可能和最先進的神經網路沾上邊?那你就錯了。根
據麻省理工科技評論在週四的報導(https://bit.ly/32UQ9RX),讓遊戲中AI更強大且難
以被擊敗的技術和神經網路開發有些雷同。
在《星海爭霸II》中,玩家要一次控制數十個不同的單位,他們各有不同的能力,同時也
要在精準掌控資源的情況下與對手決戰並獲得勝利。對於人類來說,這樣複雜的思考並不
是太過困難,然而對於電腦而言可沒那麼簡單。這是不是和開車相似呢?
Google DeepMind 系統使用一種被稱為PBT(population-based training)的演算法來讓
AI複製學習。這一套演算法讓AI得以從最有效率的單位開始學起,以此為基礎進行延伸。
這套模式同樣發生在自動駕駛訓練上。DeepMind挑選出最佳的神經網路,在有新數據加入
時再訓練或調整目前的狀態。
Waymo(Google旗下的自駕車公司)基本機器學習建設總監在接受麻省理工科技評論的採訪
時表示:「在產業上的機器學習面臨最主要的一個挑戰即是能夠建立一個有利於新代碼加
入的系統。我們要不斷的訓練並重新編寫代碼,而當你重複訓練時,常常要調整參數。」
Google已經把他們一部分的機器學習科技給商業化,但它在 Waymo 的自駕車學習上特別應
用了PBT演算法,這已經被全世界認為是最先進的自駕車系統並進行過上億公里的模擬路程
。