[問題] 若想要自己做出小朋友下樓梯的AI可行嗎

作者: hateli (kk)   2018-03-23 10:06:17
大家好 最近小弟突發奇想
很想做出一個可以自動玩小朋友下樓梯的程式(類似alphago)
目前已經看過一些莫凡的強化學習教學影片
也會使用autogui控制鍵盤滑鼠
也看了很多相關資料
但還是有點迷茫不知從何做起
請問各位前輩有沒有什麼推薦的資源呢
或是這個目標其實很困難
有較基本的練習可以推薦我
感激不盡
作者: Jeffrey11061 (Jeff)   2018-03-23 11:03:00
先能夠detect遊戲中的物件(?
作者: EGsux (天龍人)   2018-03-23 11:45:00
openAI gym 先玩一下 那邊的都不用處理遊戲內容
作者: Panthalassa   2018-03-23 12:58:00
自己試過 Reinforcement Learning 覺得痛苦XD要調的參數+硬體需求+時間 太多了推薦用基因演算法來煙化出好的 policy network*演化CNN 搭配 基因演算法就做得到 youtube 很多影片https://youtu.be/qv6UVOQ0F44
作者: CaptainH (Cannon)   2018-03-23 13:22:00
不是潑冷水 RL實務上成功的例子很少reward很難設計 最後幾乎都要靠暴力硬解
作者: Panthalassa   2018-03-23 13:26:00
推樓上
作者: vi000246 (Vi)   2018-03-23 16:24:00
有看過用AI貪食蛇 下樓梯應該也做得到吧
作者: goldflower (金色小黃花)   2018-03-23 16:37:00
覺得可以 這個獎勵很單純只是你要把什麼時候是結束之類的定義弄好給程式所以像openai他們把髒活都幫你做好是輕鬆很多
作者: hateli (kk)   2018-03-23 17:40:00
可能小弟太菜,看完之後還是沒什麼想法,會再深入研究一下各位給的資源,感謝
作者: ap954212 (death is like the wings)   2018-03-23 18:19:00
DQN 請參考deeplearning-flappy-bird的github
作者: st1009 (前端攻城師)   2018-03-23 18:27:00
偷宣傳一下,現在有AI專版唷 DataScience版
作者: Panthalassa   2018-03-23 19:35:00
既然指定要小朋友下樓梯就沒有 openai 的資源了不建議從頭刻 RL,變因太多,訓練失敗的話難 debug 難 tune
作者: bibo9901 (function(){})()   2018-03-24 01:08:00
貪食蛇的AI應該很簡單吧...不需要用train的
作者: Panthalassa   2018-03-24 04:39:00
樓上是指 rule based 的嗎?用 Train 的不僅是為了讓機器玩而是讓機器從錯誤學習,這意義非凡
作者: neil987 (R5大小姐-EX人品崩壞)   2018-03-24 15:52:00
只是我有個疑問是 這樣會收斂嗎
作者: goldflower (金色小黃花)   2018-03-24 17:45:00
exploration沒辦法讓結果更好 就能說(希望)收斂惹吧
作者: hateli (kk)   2018-03-25 15:06:00
各位前輩,如果是改做皮卡丘打排球呢?先單純左右移動防守這樣,若要學習各種球路會比較適合什麼演算法呢?想說這樣會不會簡單點
作者: sean50301 ( (づ′・ω・)づ)   2018-03-26 03:14:00
實習有做過用RL調整交易策略的專案 reward真的是關鍵

Links booklink

Contact Us: admin [ a t ] ucptt.com