[閒聊] AI玩遊戲學習非最佳解會怎樣 RLAPH PTT批踢踢實業坊

[閒聊] AI玩遊戲學習非最佳解會怎樣

作者: RLAPH (西表山貓) 2025-02-24 14:45:43

嗯吶
好奇問一下啊
大家都知道LOL這種遊戲
如果給AI練習走位大概會比非可還強
而AI一向是朝最佳解去學習的
但就好奇啊
如果給AI餵像是羅傑或是大開的操作
逼迫AI去學習非最佳解
會變什麼樣啊？
有人知道咪？

作者: Shichimiya (便當) 2025-02-24 14:47:00

死歌不會開大因為不知道唱哪

作者: ZielC 2025-02-24 14:47:00

input trash output trash

作者: qd6590 (說好吃) 2025-02-24 14:48:00

傑西沒大

作者: nahsnib (æ‚Ÿ) 2025-02-24 14:48:00

不如讓他學習怎麼跟聊天時室對線

作者: ss8901234 (絕命六龜葡萄) 2025-02-24 14:48:00

傑西沒大

作者: GTOyoko5566 (雞頭洋子) 2025-02-24 14:48:00

AI學走位的巔峰不就腳本外掛嗎？==

作者: arrenwu (鍵盤的戰鬼) 2025-02-24 14:49:00

腳本有需要用深度學習嗎？

作者: a43164910 (å¯ºæ‰ä¼Šå…) 2025-02-24 14:49:00

聊天室老媽祖墳會爆開

作者: ZielC 2025-02-24 14:49:00

不是說髒話，但以最佳化的觀點去看就是上面的結論

作者: GTOyoko5566 (雞頭洋子) 2025-02-24 14:50:00

腳本還會跟人搶滑鼠，AI親自上我都不敢想

作者: lsd25968 (cookie) 2025-02-24 14:50:00

你模型還是會算loss啊所以還是會收斂

作者: serding (累緊地們) 2025-02-24 14:52:00

不如請AI玩動漫歌二選一

作者: kirimaru73 (霧丸) 2025-02-24 14:53:00

AlphaGO第一版就是這樣，餵食了大量人類棋譜後來的結論就是人類圍棋什麼弱雞，不餵食的版本更強不過弱雞版AlphaGO還是能夠4：1李世石

作者: chctonagisa (chc) 2025-02-24 14:53:00

操作爛的一次偏左一次偏右平均下來還是一樣

作者: ZielC 2025-02-24 14:53:00

然後完全最佳化，同時閃避+維持輸出範圍的情況，跟腳本應該要是相同的行動，只是原理變成你學習抓到那一frame輸出移動指令要怎麼下而已。腳本比較像是直接抓對面丟技能的事件

作者: kirimaru73 (霧丸) 2025-02-24 14:54:00

AlphaGO零號(不看人類棋譜)則在網路上匿名痛電所有職業棋手，60：0

作者: zack867 (心裡有佛看人便是佛) 2025-02-24 14:55:00

像初版學人類alphago一樣強度比後來自己練的版本低吧？

作者: kirimaru73 (霧丸) 2025-02-24 14:57:00

人類圍棋知識中有少數確實是弱雞，一些小時候你下了會被老師釘在牆上的「臭棋」，現在可以換老師被釘在牆上不過大多數人類結論還是和AI一致，也沒有多丟臉

作者: GTOyoko5566 (雞頭洋子) 2025-02-24 14:57:00

用格鬥來說，電腦比人類笨的地方在於能騙招，但是這種電腦都是事先寫好了，所以能騙一次就是騙無數次，如果電腦本身會學習並改良，那我想不到人類要怎麼贏你跳就623，你投就秒拆投，你做的任何動作電腦都能反應，做的都是錯的，想想就有夠牢

作者: zealotjacky (ç‹‚æˆ°) 2025-02-24 15:03:00

所以有的訓練會把AI的反應時間限制成人類等級就是避免AI秒讀招然後拆解但實際上人類根本做不到

作者: kuninaka 2025-02-24 15:04:00

早有了

作者: milkool 2025-02-24 15:07:00

阿法狗：學你們人類棋譜不如自我學習人類喂AI現有招式不會讓AI進化

作者: ccpz (OoOoOo) 2025-02-24 15:07:00

local optimal or global optimal

作者: inte629l 2025-02-24 15:08:00

感覺就是對策略空間限制搜索範圍之類的?就像對一個獎勵函數加一個限制約束項

作者: twosheep0603 (兩羊) 2025-02-24 15:13:00

全看你怎麼給獎勵函數https://b23.tv/wcGv3pl 可以看看這篇是怎麼訓練的

作者: CYHyen (CYHyen) 2025-02-24 15:26:00

反正AI現在遊戲的結論就是全面爆殺人類，什麼大局觀、不完全資訊、細部操作。人類都是弱雞

作者: kuninaka 2025-02-24 15:40:00

至少AI還沒辦法自己做遊戲出來

作者: devan35783 (阿西八) 2025-02-24 16:11:00

星海2無限制AI好像真的會噴垃圾話

作者: kluele585 (漆黑烈焰大魔法師) 2025-02-24 16:14:00

可能還是會很強就像初代alphago就是餵了很多人類棋譜事實證明沒喂讓他自己學比較強

繼續閱讀

[閒聊] 睦媽是不是想找一個打倒怪物的勇者QBian [Vtub] 萊爾富hololive 二波預購ransan [母雞]KiLLKiSS cover 整團都是同一人tsubasa0922 [MyGO] 大合照但沒有你anpinjou [閒聊] 碧藍航線動態造型換裝-斯庫拉sunlockfire [母雞.轉載] 故事混亂？帶你看懂Ave Mujica！jiwalliam [閒聊] 人中之龍8外傳 - 缺乏動力驚喜不再 Alixwaltz [討論] 長年跑外送是啥感覺astrayzip Re: [閒聊] 機器人不是效率不佳怎麼開始推廣人形了SweetBreaker [閒聊] 動漫裡有名的55開ooxxegg

相部屋NTR 絶倫上司に美人OLが膣堕ちして一晩中不倫セックスで乱れ狂った出張先の夜吉岡ひより

激イキ167回！痙攣4203回！イキ潮2018cc！現役純真アイドルエロス覚醒はじめての大・痙・攣スペシャル前田美波

湊莉久AV引退 S1全17タイトル完全コンプリートMEMORIAL BEST16時間

作業着で隠していた健康的グラマラスボディ隠れGcupドボジョのむっつり肉弾性交佐山由依 AVデビュー

【VR】海でイケイケなギャルをナンパしたら、アヘ顔でイキまくる変態ギャルだった件椿りか