作者:
LCamel (LCamel)
2017-08-10 09:46:56DeepMind and Blizzard open StarCraft II as an AI research environment
Wednesday, 9 August 2017 (縮 https://goo.gl/KSfFFa )
DeepMind (世界最強圍棋 AI 那家) 和 Blizzard 共同發表新的 AI 開發環境,
"SC2LE" , 其中包括了:
* A Machine Learning API developed by Blizzard that gives researchers
and developers hooks into the game. This includes the release of tools
for Linux for the first time.
Blizzard 公開一套給機器學習用的接口
https://github.com/Blizzard/s2client-proto
The StarCraft II API is an interface that provides full external control
of StarCraft II.
可以讓外部程式控制 SC2.
This API exposes functionality for developing software for:
這套接口可以用來開發:
* Scripted bots. 寫死規則的傳統 bot
* Machine-learning based bots. 機器學習的 bot
* Replay analysis. 分析 replay 錄影 (才知道高手怎麼玩)
* Tool assisted human play. 人玩, 同時工具在旁協助 (這沒問題嗎?)
The API is available in the retail Windows and Mac clients.
There are also Linux clients available at the download links below.
零售版的 Windows / Mac 星海可用. Linux 也有.
* A dataset of anonymised game replays, which will increase from 65k
to more than half a million in the coming weeks.
將陸續公開超過 50 萬場 replay 來讓大家有得學.
* An open source version of DeepMind’s toolset, PySC2,
to allow researchers to easily use Blizzard’s feature-layer API
with their agents.
https://github.com/deepmind/pysc2
"... It exposes Blizzard Entertainment's StarCraft II
Machine Learning API as a Python RL Environment."
把上述接口包成 python 語言可以用的強化學習環境.
* A series of simple RL mini-games to allow researchers to test
the performance of agents on specific tasks.
一些讓研究者可測試的小任務.
採礦採礦 生兵生兵
https://www.youtube.com/watch?v=6L448yg0Sm0
* A joint paper that outlines the environment, and reports initial
baseline results on the mini-games, supervised learning from replays,
and the full 1v1 ladder game against the built-in AI.
https://deepmind.com/documents/110/sc2le.pdf
一篇兩家公司共同發表的目前成果, 作為大家開始的起點.
影片中右邊的訓練成果看起來還有模有樣的呢:
https://www.youtube.com/watch?v=WEOzide5XFc
LCamel
作者:
kira925 (1 2 3 4 疾風炭)
2017-08-10 09:48:00為什麼要在礦區蓋BS...XD
AI常常會下出與自身常識不符合的動作萬一這樣採礦效率比較高呢XDDD
作者:
EGsux (天龍人)
2017-08-10 09:56:00那個只是在訓練裡的動作 不是在對戰
作者:
kira925 (1 2 3 4 疾風炭)
2017-08-10 10:12:00是可以理解對T來說可以偷一咪咪的來回時間拉但是卡到的時間成本大概沒被計入...
作者:
kira925 (1 2 3 4 疾風炭)
2017-08-10 10:26:00有趣的是 為什麼現在都只看到人族?
作者:
lather (煞氣ㄟ溺水)
2017-08-10 10:58:00因為t可以多線投到你崩潰
作者:
teren (blank)
2017-08-10 11:17:00因為AI認證的TIMBA
作者:
APM99 (血統純正台北人)
2017-08-10 11:22:00影片中的AI是學了50萬場青銅組的錄像嗎 ...
作者:
win4104 (BB)
2017-08-10 11:25:00因為這個AI不像我們有十幾年的遊戲經驗他沒有一般玩家的遊戲直覺吧
可能是DeepMind沒買序號,只能玩免費的XDDD
作者: luckhunter (大番薯) 2017-08-10 11:41:00
因為人類的操作空間在AI下可以無限大
作者:
kira925 (1 2 3 4 疾風炭)
2017-08-10 11:47:00那個AI只有採礦一個任務
Tool assisted human play應該意思是用工具輔助達成 人類理論上可以辦到的完美play就像是Tool assisted speedrun (TAS) 也都是人玩的但實際上根本玩不出來 XD
作者:
gmoz ( This can't do that. )
2017-08-10 11:59:00API也出了XD
作者:
eggli (eggli)
2017-08-10 12:00:00作者:
gmoz ( This can't do that. )
2017-08-10 12:02:00借轉八卦?
作者:
eggli (eggli)
2017-08-10 12:03:00貼個[天網]tag (誤
作者:
positMIT (MarineQueen)
2017-08-10 12:50:00push!
作者:
positMIT (MarineQueen)
2017-08-10 13:17:00untrained AI----->trained AI----->>innovation
這些工具可以讓一般人做出什麼呢? 類似可以在自訂開遊戲然後讓AI自己操控電腦打嗎?
作者:
kira925 (1 2 3 4 疾風炭)
2017-08-10 13:38:00給想要玩AI開發的人可以玩
作者:
win4104 (BB)
2017-08-10 14:37:00我講的直覺是GameSence 也是透過遊戲經驗的累積透過參考過往的經驗來分析 這點應該跟AI的學習是一致的
作者:
kira925 (1 2 3 4 疾風炭)
2017-08-10 14:57:00確實是一致的 訓練AI的時候會有個模擬獎賞的機制鼓勵AI的類神經網路權值矩陣 只是RTS因為戰爭迷霧讓他變複雜
Bug report:Shu Dong Huang
作者:
tasin (Ringo)
2017-08-10 15:29:00快贏得時候砸AI礦螺 它會學起來嗎
作者: gouran (群爭) 2017-08-10 16:23:00
太陽拳!!!
作者:
JokerRF (RF)
2017-08-10 18:05:00AI:干死黃旭東
作者:
Pony5566 (Luna Akbar)
2017-08-10 19:08:00AI不知道會不會受到四川神祕力量影響
作者:
kane111 (kane)
2017-08-10 20:13:00星海操作的影響程度太大,不知道最後怎麼樣評斷訓練的結果
作者:
Timba (踢音霸)
2017-08-10 22:34:00狂!!!!! 他會不會模仿對手阿???輸了時候 都被丟礦螺 贏的時候會不會也學起來??
作者: vul3kuo (Glory) 2017-08-10 22:45:00
期待看到像圍棋那樣 出現顛覆常理的玩法
作者:
shentis (夜寅)
2017-08-10 23:24:00說不定後面知道自己快贏了,一堆工兵跑到對手家噴漆XD
可能會來比個 執政官 阿法狗:可以投降了 玩家:我不要阿法狗默默的放推
作者: h311013 2017-08-11 01:29:00
大衛精一調整 AI武功盡失 XD
作者:
jyunwei (jyunwei)
2017-08-11 11:40:00操作除了分鐘操作數以外會不會點錯也是影響
作者:
gmoz ( This can't do that. )
2017-08-11 12:54:00理論上不會點錯
作者:
banmi (數學小天兵)
2017-08-11 15:31:00照這樣發展下去,不知道有沒有一天會出現天網??
作者:
kira925 (1 2 3 4 疾風炭)
2017-08-11 16:48:00AI是不會點錯的阿....
作者:
oldTim (TIME WILL TELL)
2017-08-11 21:00:00這篇可以讓圍棋界那些瞧不起星海的人閉嘴了論文上Deepmind試了各種不同的深度學習架構,結果根本沒用只有在某些mini-game裡面才能訓練出職業等級的操作要打full game還打不過暴雪內建AI,看來Deepmind沒辦法了所以開源來請大家集思廣益。