1.媒體來源:
聯合
2.記者署名:
楊又肇
3.完整新聞標題:
DeepMind打造會自主學習新規則的人工智慧MuZero
4.完整新聞內文:
Alphabet旗下人工智慧技術公司DeepMind,宣布推出名為MuZero的人工智慧系統,標榜在
完全不了解規則情況下,即可快速熟悉圍棋、西洋棋、將棋,或是57款Atari電子遊戲遊
玩規則,並且取得更好遊玩表現。
依照DeepMind說明,MuZero的技術背後,代表可藉由人工智慧技術也覺日常生活中複雜規
則,或是事前無法確知規則的難題。
相比現有DQN、R2D2或Agent57人工智慧技術,MuZero能以更快效率找出既有規則,並且快
速解決問題。而MuZero的技術更代表能讓人工智慧有規劃思考能力,並且利用現有條件統
整規則,即便面臨全新運算場景也能快速找出問題解決方式。
過去研究人員分別透過預先搜尋 (lookahead search),以及基於現有運算模型規劃能力
,讓人工智慧能針對未知規則情況進行運算,但由於既有運算方式仍仰賴前期規則訓練,
因此必須花費更多時間才能順利找出全新運算環境對應規則,因此並不適合用於解決未知
條件的運算需求,同時也難以解決條件相對複雜的運算情境。
因此DeepMind在MuZero技術採用不同作法,而是讓人工智慧可依照當前蒐集資訊進行分析
學習,藉此縮短在變動條件環境運算所需時間,其中包含當前決策價值、最佳運算決策,
以及前一個決策執行成果,藉此進行反覆學習,進而從中學習最佳規則執行決策能力。
在這樣的運算模型執行下,將可讓MuZero人工智慧技術在圍棋、西洋棋、將棋,或是57款
Atari電子遊戲更快發揮執行效果,甚至在棋藝能力比擬AlphaZero,並且在Atari電子遊
戲執行成果更勝現有人工智慧技術。
同時,若允許MuZero以更長時間進行「思考」,其在棋藝表現會有更顯著下子正確率,並
且呈現更精湛的進攻方式,甚至可在電子遊戲內容有更高學習效率。
未來DeepMind團隊預計利用MuZero技術解決更多人工智慧前期學習與分析未知解法問題,
預期未來也能讓更多機器人、自駕車等經常處於未知判斷條件的運算需求,能在更短時間
內找到合適執行方式。
5.完整新聞連結 (或短網址):
https://udn.com/news/story/7086/5120425
6.備註: