1.媒體來源: 中時
2.完整新聞標題: 繼圍棋之後 小精靈遊戲被微軟AI征服了
3.完整新聞內文:
在西洋棋、圍棋與德州撲克之後,下一個被AI(人工智慧)征服的挑戰是什麼呢?答案是:
小精靈遊戲(Pac-Man)。微軟在今年收購的一家深度學習(deep learning)新創公司,近日
發表了最新研究成果,成功在小精靈這款遊戲取得遊戲最高分。看見電腦程式玩得比你我
還厲害,真讓人無顏見江東父老了。
根據微軟官方部落格,他們在2017年1月收購的加拿大深度學習新創公司Maluuba,所研發
的AI系統在Atari 2600版Pac-Man中成功取得999990的最高分。過往從沒有人類或是AI系
統曾達到此一分數,相當值得注目。
位於加拿大蒙特婁MaGill大學的電腦科學系副教授Doina Precup表示,這是AI研究者的一
個關鍵成就。因為AI研究者們一直在尋找各類型的遊戲來測試所研發的系統,而Pac-Mac
被發現是遊戲當中最難攻克的一款。而不僅對於微軟研發團隊的成就感到印象深刻,
Doina Precup更表示,他認為研發團隊如何找出破解的方法,更是重要!
Maluuba採用的方法很特別。首先他們將過關的策略跟技巧分為獨立的元素,例如「吃豆
」跟「閃避敵人」,且不同的AI(研發團隊稱之為agents)則專注於不同的遊戲任務。之後
再由更高層的AI agent來決定要優先執行那一種任務。
舉例來說,如果遊戲中有100個AI agent期待往左移動來吃掉一個豆子,但只有3個AI
agent決定要往右來躲避敵人。最終最高AI agent的決策會是往右移動,來避免撞上敵人
而失敗。
根據微軟部落格,Pac-Man一直以來在AI研究廣泛被使用,因為玩法具有不可預測性。而
Maluuba則運用了強化學習(reinforcement learning)的技術,也就是針對某一個特定問
題,讓AI獲得正面或者負面的回饋,來應對不可預測性。這一項技術被認為可以協助AI系
統自動進行決策,因為提供了正面與負面的的案例,來協助AI系統建立起經驗基礎,與監
督式學習(supervised learning,機器學習當中的一種)不同。(中時電子報)
4.完整新聞連結 (或短網址):
http://www.chinatimes.com/realtimenews/20170616002835-260412
5.備註: