Re: [閒聊] 人機大戰觀後雜感

作者: devidevi (蜜蜜)   2017-05-28 15:09:20
※ 引述《Maybetrue (電子黑手)》之銘言:
: ※ 引述《hdjj (hdjj)》之銘言:
: 是一個災難。比如說我們拿AG管理雙北市的紅綠燈,我們希望AG管理的紅綠燈讓交通更
: 順利,結果一個突如其來的災難,讓AG耍憨了起來,搞得全雙北市的紅綠燈通通在亂閃
: 。這是絕對不可以的。以上週團體賽的結果來說,古力那一邊的Alphago 就是在耍憨,
: 而且Alphago 不是軟體工程師key 出來的函數庫,它是自我學習的整體。我猜目前
: deepmind並沒有能力修改AG讓他能在逆境採取積極對策。因為如果去年AG被李世石挖到
: 發瘋,今年重新再次自我學習應該也要把這一點改掉,但是結果並沒有,只是用強大的
: 能力掩蓋這個弱點而已。只要有個人類 (豬隊友?)在旁邊作亂,AG個體能力再強也要發
: 瘋。但是,AG發瘋是不被允許的。事實證明,AG如果傻掉,能力比常人還差。套用到更
: 大的系統面上去的話將會造成毀滅性災難。
簡單說一下原PO所說的問題點
目前deepmind的AG,在正常運作下沒有問題
但發生意外,或突發狀況時,AI並不會讓損失減到最小,而是開始錯亂...
沒人可以保證完全不出任何意外,
但如果AI只有正常運作下沒有問題
當有外力介入,產生意外時,AI並不能讓損失控制到最小,並且產生錯亂...
這是AG要解決的下一步問題..
作者: ykes60513 (いちご)   2017-05-28 15:11:00
不曉得虛竹那種自殺招能不能讓AlphaGO錯亂XD
作者: bxxl (bool)   2017-05-28 15:13:00
我覺得控制權切來切去,現在的飛機自動駕駛可能也會有問題吧但不代表這東西不能用,只代表你不能頻繁的切來切去而已
作者: ilw4e (可以吃嗎?)   2017-05-28 15:14:00
要控制損失就訓練時給他其他條件就好阿,比方說放棄點勝率可是要求輸的時候要輸最少你要AI符合你想的去做,你給他的條件目標就要明確現在是條件太單純:勝率極大+贏 他一切行為當然就照這個
作者: OROCHI97 (OROCHI97)   2017-05-28 15:28:00
如果賭錢,一目一千,AG大概都是把把都贏一點點那種是吧
作者: bxxl (bool)   2017-05-28 15:31:00
AI量產之後的確不會具備學習功能 AG也沒有邊下邊更新不受控制的學習是很危險的,應該是廠商統一處理
作者: ilw4e (可以吃嗎?)   2017-05-28 15:34:00
勝率低會那樣就是你給的條件問題啊,你要他特殊情況符合你期待你就得給他其他條件阿,這不是基本邏輯嗎?他是機器不是神,他還是照你給的腳本去學的阿:D
作者: bxxl (bool)   2017-05-28 15:35:00
這是目標函數的問題,勝率就代表不管輸得多慘就是一敗其實人類世界也有,比如說棒球比分差太多就派野手上去投這時就只求結束比賽,不會想再去縮小分差了. 俗稱垃圾時間總之,你想要怎樣的行為,就採用相應的目標函數,並且把各種極端狀況該如何處理放入訓練資料,練出來的才會是你想要的現在就是他的訓練目標是A,你說他B的時候不行,改變的方法是把訓練目標改成f(A,B), 一個綜合考慮A跟B的函數
作者: wadashi1 (阿拉丁)   2017-05-28 15:47:00
如果能自始至終,完全鬥狠,不下緩著的阿法狗,會精彩許多!
作者: ilw4e (可以吃嗎?)   2017-05-28 15:58:00
AI互下的譜很多都很狠,互相殺龍XD
作者: lyricslee (奕)   2017-05-28 15:59:00
你怎麼不懂...人家目標就是贏,你又要人家少輸減少損失又不等於創造贏的機會
作者: ilw4e (可以吃嗎?)   2017-05-28 16:06:00
那樣代表你程式沒寫好,回去重寫,AI沒有好壞XD
作者: touyaman (とーやまん)   2017-05-28 16:12:00
為啥跳到討論自動駕駛拉= = 到時候AI學習又是別的方法拉事實就是AI圍棋已經無敵 以後開發出的自動駕駛也會比人自己開安全
作者: OverInfinity (超越無限)   2017-05-28 16:19:00
歹稍微瞭解一點深度學習是什麼…自動駕駛來說你在訓練階段就要加入突發事件讓他學啊
作者: bxxl (bool)   2017-05-28 16:29:00
感覺一直在鬼打牆,又沒人說AG要去開車,AG也不是唯一的AI把目標函數換一換行為就會差很多,一直拿AG的行為去推演幹嘛?
作者: vencil (vencs)   2017-05-28 16:46:00
等著看阿爾法AI學打星海,那才是自駕這樣不完全訊息的類比至於拿圍棋訓練的AI比自駕根本不能類比
作者: rainycats (海狸個摩門特)   2017-05-28 16:59:00
用想像的你要不要去看一下網頁https://waymo.com/ontheroad/實際上路測試就是在train. 理論上只要樣本數夠你想像得到的狀況都會在裡面另外還有一些其他的專利goo.gl/5xQrxX真實上路前鐵定train了一般人一輩子都達不到的里程數如果還有發生無法處理的情況(飛機掉下來之類的)我跟你說AI處理不來的人只會更差....反正你要比出事率的話, 自動駕駛的出事率絕對比人低的多, 你來矽谷待久一點, 就可以看到無人車開來開去看到無人車比看到美國三寶開車令人安心多了
作者: nkfcc (球春..)   2017-05-28 17:09:00
你知道AG要拿去作什麼了?
作者: ddavid (謊言接線生)   2017-05-28 17:18:00
自動駕駛就是目標函數的複雜度更高啊,你一直拿圍棋的目標函數訓練出來的結果談自動駕駛根本就錯置圍棋的目標函數本來就不包括意外處理的部分,當然不會有意外處理的表現AlphaGo表現好確實不能表示100%轉為自動駕駛的目標函數後一定也可以訓練到同等級好,但反之在AlphaGo上出現的缺點(事實上在圍棋來說甚至不算缺點)也同樣並不會保證在改變為自動駕駛的目標函數後還會出現
作者: chris610020 (可悲的阿明)   2017-05-28 17:28:00
自動駕駛比圍棋....圍棋能開圖,自動駕駛能嗎?
作者: aegis43210 (宇宙)   2017-05-28 17:31:00
deepmind目前想走的是醫療和星海爭霸哦
作者: ddavid (謊言接線生)   2017-05-28 17:37:00
Starcraft 2那個也只是過程而已,跟圍棋一樣是驗證學習能力以及宣傳居多
作者: wz02022 (Jeter)   2017-05-28 18:37:00
沒錯阿 AG的確有這個缺陷 所以人工智慧還可以進步很多
作者: y800122155 (@__@)   2017-05-28 21:47:00
噓 勝負分類問題 跟 輸贏目數回歸問題 完全不一樣 懂?
作者: CGary (下雨天也挺浪漫的)   2017-05-28 23:40:00
SC2 之所以值得試是因為不完全公開資訊遊戲在電腦看起來難度很高 我們覺得SC2比圍棋簡單是我們的「設計」理念跟電腦不同...
作者: jake255121 (微花猴傑)   2017-05-29 03:01:00
輸得少但絕對不會贏的步為啥要去下,就事論事
作者: mm58307533   2017-05-29 12:27:00
輸了就直接認輸了吧,盤面差很多還繼續下??

Links booklink

Contact Us: admin [ a t ] ucptt.com