[問題] 若想要自己做出小朋友下樓梯的AI可行嗎 hateli PTT批踢踢實業坊

[問題] 若想要自己做出小朋友下樓梯的AI可行嗎

作者: hateli (kk) 2018-03-23 10:06:17

大家好最近小弟突發奇想
很想做出一個可以自動玩小朋友下樓梯的程式(類似alphago)
目前已經看過一些莫凡的強化學習教學影片
也會使用autogui控制鍵盤滑鼠
也看了很多相關資料
但還是有點迷茫不知從何做起
請問各位前輩有沒有什麼推薦的資源呢
或是這個目標其實很困難
有較基本的練習可以推薦我
感激不盡

作者: Jeffrey11061 (Jeff) 2018-03-23 11:03:00

先能夠detect遊戲中的物件（？

作者: EGsux (天龍人) 2018-03-23 11:45:00

openAI gym 先玩一下那邊的都不用處理遊戲內容

作者: Panthalassa 2018-03-23 12:58:00

自己試過 Reinforcement Learning 覺得痛苦XD要調的參數+硬體需求+時間太多了推薦用基因演算法來煙化出好的 policy network*演化CNN 搭配基因演算法就做得到 youtube 很多影片https://youtu.be/qv6UVOQ0F44

作者: CaptainH (Cannon) 2018-03-23 13:22:00

不是潑冷水 RL實務上成功的例子很少reward很難設計最後幾乎都要靠暴力硬解

作者: Panthalassa 2018-03-23 13:26:00

推樓上

作者: vi000246 (Vi) 2018-03-23 16:24:00

有看過用AI貪食蛇下樓梯應該也做得到吧

作者: goldflower (金色小黃花) 2018-03-23 16:37:00

覺得可以這個獎勵很單純只是你要把什麼時候是結束之類的定義弄好給程式所以像openai他們把髒活都幫你做好是輕鬆很多

作者: hateli (kk) 2018-03-23 17:40:00

可能小弟太菜，看完之後還是沒什麼想法，會再深入研究一下各位給的資源，感謝

作者: ap954212 (death is like the wings) 2018-03-23 18:19:00

DQN 請參考deeplearning-flappy-bird的github

作者: st1009 (前端攻城師) 2018-03-23 18:27:00

偷宣傳一下，現在有AI專版唷 DataScience版

作者: Panthalassa 2018-03-23 19:35:00

既然指定要小朋友下樓梯就沒有 openai 的資源了不建議從頭刻 RL，變因太多，訓練失敗的話難 debug 難 tune

作者: bibo9901 (function(){})() 2018-03-24 01:08:00

貪食蛇的AI應該很簡單吧...不需要用train的

作者: Panthalassa 2018-03-24 04:39:00

樓上是指 rule based 的嗎？用 Train 的不僅是為了讓機器玩而是讓機器從錯誤學習，這意義非凡

作者: neil987 (R5大小姐-EX人品崩壞) 2018-03-24 15:52:00

只是我有個疑問是這樣會收斂嗎

作者: goldflower (金色小黃花) 2018-03-24 17:45:00

exploration沒辦法讓結果更好就能說(希望)收斂惹吧

作者: hateli (kk) 2018-03-25 15:06:00

各位前輩，如果是改做皮卡丘打排球呢？先單純左右移動防守這樣，若要學習各種球路會比較適合什麼演算法呢？想說這樣會不會簡單點

作者: sean50301 ( (づ′・ω・）づ) 2018-03-26 03:14:00

實習有做過用RL調整交易策略的專案 reward真的是關鍵

繼續閱讀

pycharm 取得命令列引數snakei14702 [問題] 新手請問大大word檔轉HTML問題johnnyaj3 [問題] 新手玩RPI3的問題__AD/DA boardvirginbear [問題] numpy套件版本差異PyTorch [問題] 新手請教 GCP nuinx+uwsgioscar0130 [問題] Google圖書有推薦的py中文書嗎VAIOBIOS Re: [問題] 切字串 split cutekid Re: [問題] 切字串 split shadowjohn Re: [問題] 切字串 split ctr1 [問題] 切字串 split ctr1