Open人工智慧1v1勝Dota2最強玩家 將開啟5v5模式
文章來源:機器之心
在 Dota2 一對一表演賽中,由 OpenAI 設計的 bot 打敗了 Danylo “Dendi”
Ishutin,一名在職業生涯中已經贏得 735,449.40 美元獎金的職業玩家。OpenAI 的
bot 在第一場比賽開始約 10 分鐘打敗了 Dendi。在第二場比賽中 Dendi 放棄,並拒絕
進行第三場比賽。
在人機匹配賽之前,OpenAI CTO Greg Brockman 解釋了該公司的特製 bot 接受了一
千次比賽的訓練,訓練由 OpenAI 進行指導。Brockman 還聲稱這個 bot 已經打敗多個‘
Dota 2’職業玩家。
人工智慧公司向來喜歡通過視頻遊戲測試其技術:DeepMind 選擇了星際爭霸 2,而
微軟則在最近宣佈要在 Ms。 Pac-Man 取得佳績。Brockman 說,OpenAI 並不打算淺嘗輒
止,而是希望其 bot 明年可在 Dota 5 對 5 遊戲中作戰。同時,OpenAI 將會發佈該
bot,從而人人可以與其對決,並且舉辦方 Valve 將為擊敗該 bot 的第一個人類玩家提
供遊戲幣獎勵。
以下是 OpenAI 官方博客對該比賽的介紹:
我們已創建了一個 bot,它在標準聯賽規則下的 Dota 2 1 對 1 比賽中擊敗了人類
頂級職業玩家。該 bot 通過自學從頭學習 Dota,但並沒有使用模仿學習或樹搜索。這向
構建在涉及真實人類的複雜環境中達成精確目標的人工智慧系統邁出了前進的一步。
今天我們在國際賽的主賽場與 Dendi 對戰,贏了一場三局兩勝比賽。在過去一周中
,我們的 bot 在與許多頂級專業玩家,包括 SumaiL(世界 1v1 頭號玩家)和 Arteezy
(世界頭號全能玩家)對戰時依然保持不敗戰績。
Dota 1v1 是一個具備隱藏資訊的複雜遊戲。智慧體必須學習規劃、攻擊、設局以及
欺騙對手。玩家技能和每分鐘運算元(actions-per-minute)之間的關聯不是很強,事實
上,我們的 AI 的每分鐘運算元相當於人類玩家的平均水準。
在 Dota 中取勝需要玩家基於對對手的直覺而採取相應操作。在上面的視頻中你可以看到
我們的 bot 已經習得了——完全通過自我對弈——預測其他玩家的下一步操作,在陌生
的環境中隨機應變,以及通過對其他玩家的友軍施加影響而幫助前者成功。
一場完整的 Dota 比賽包括兩個戰隊,每隊五人。每個玩家需要從一百個英雄和數百
種裝備之間進行選擇。我們下一步將創建一個可與人類戰隊競爭和合作的 Dota 2 bot 戰
隊。
http://sports.sina.com.cn/go/2017-08-12/doc-ifyixiar9935523.shtml