Re: [新聞] 暴雪結合DeepMind人工智慧 開發星海爭霸2

作者: freshmints (只求早點休息)   2016-11-06 01:54:39
※ 引述《dulinove (C.A.B.A.L
作者: Aggro (阿果)   2016-11-06 01:56:00
我想到閃電霹靂車的阿斯拉
作者: FallenAngelX (跌倒)   2016-11-06 01:58:00
只能推
作者: twosheep0603 (兩羊)   2016-11-06 02:03:00
我覺得今天會這樣混淆應該是AI這個詞太過泛濫
作者: Aksky (喔!喔!!喔!!!)   2016-11-06 02:08:00
我倒是想看DeepMind被人換家會有啥反映,說不定挺有趣的XD
作者: fosa (阿盛)   2016-11-06 02:09:00
AlphaGO被搞怎麼會哭呢...就是一場敗場把過程輸入資料庫而已
作者: GOBS (GodOfBullShit)   2016-11-06 02:10:00
我覺得阿法狗玩星海應該很快就學會"偵查"的重要性了在資訊越多的情況下它就可以付出越少的運算空間再推斷對方的行為 而且它的學習系統包括模仿對局 只要多看一點高端場應該就知道一些偵查的時間點 像是第一支王蟲 何時出OB之類的
作者: w60904max (自宅警備隊員)   2016-11-06 02:13:00
圍棋還有思考時間 這真的一大挑戰
作者: GOBS (GodOfBullShit)   2016-11-06 02:15:00
...你要這樣說講得好像人類玩的時候不需要花資源偵查當電腦意識到這樣的偵查是必要時它就會跟著做了
作者: Aksky (喔!喔!!喔!!!)   2016-11-06 02:16:00
偵查還要考慮對手的戰術欺騙,不可能每場都照表操課的
作者: arrenwu (鍵盤的戰鬼)   2016-11-06 02:17:00
AlphaGO 下圍棋也沒有所謂的完美啊他只是在以知的範圍內找一個看起來最ok的做法而已
作者: Sischill (Believe or not)   2016-11-06 02:18:00
你只講到微操 那請問多線呢? 人腦在天生就沒電腦能夠快
作者: kinghtt (萬年潛水伕)   2016-11-06 02:18:00
要AI崩潰得先確定星海的可能性分支有比圍棋多
作者: arrenwu (鍵盤的戰鬼)   2016-11-06 02:19:00
我覺得星海要處理的部分是資料的部分
作者: siyaoran (七星)   2016-11-06 02:19:00
AlphaGO玩快棋弱很多 這真的對它是一大挑戰
作者: Sischill (Believe or not)   2016-11-06 02:19:00
微操結果家裡營運或小地圖漏看都會發生 問題是對電腦來說會發生這種錯誤嘛?
作者: kinghtt (萬年潛水伕)   2016-11-06 02:20:00
阿法狗在面對選擇時會走勝算最高的步數,直到對手改變
作者: ttt95217 (略)   2016-11-06 02:20:00
電腦打星海應該很強吧 可以微控一隊遠程兵?
作者: kinghtt (萬年潛水伕)   2016-11-06 02:21:00
策略才會再次計算可能性,星海中可以選擇穩健發展策略
作者: w60904max (自宅警備隊員)   2016-11-06 02:22:00
我想是確定敵方戰術後 就照設定的最佳解執行下去了
作者: kinghtt (萬年潛水伕)   2016-11-06 02:22:00
讓勝算維持一定程度
作者: arrenwu (鍵盤的戰鬼)   2016-11-06 02:22:00
星海只是知道的比較少而已,當下還是有最佳的策略遇到前面有陷阱之後,就會有另一個策略
作者: GOBS (GodOfBullShit)   2016-11-06 02:23:00
對抗埋地毒爆電腦會出渡鴨吧 面對隱形單位最高CP的做法
作者: w60904max (自宅警備隊員)   2016-11-06 02:23:00
然後微操 交戰 都靠rule直接解 跟一般遊戲AI一樣
作者: arrenwu (鍵盤的戰鬼)   2016-11-06 02:23:00
除了資料輸入之外,星海跟圍棋沒有差那麼多
作者: Sischill (Believe or not)   2016-11-06 02:23:00
我想前面有埋地毒爆/雷 這跟電腦或人腦沒啥關係 都是靠
作者: Curapikt (StarLight Breaker!!)   2016-11-06 02:24:00
google先想辦法生出SC的演算法吧,能下圍棋是因為有對應
作者: twosheep0603 (兩羊)   2016-11-06 02:24:00
玩星海算不算挑戰讓電腦解Bayesian game的平衡點啊
作者: kinghtt (萬年潛水伕)   2016-11-06 02:24:00
直到玩家被偵測到確定的一手後電腦再改變策略就好
作者: Sischill (Believe or not)   2016-11-06 02:24:00
偵查探知的吧?
作者: w60904max (自宅警備隊員)   2016-11-06 02:26:00
他指的是從答案 執行操作的部分吧deep learing 只是幫你先整理好可能狀況 及對應答案圍棋那套 有另一個快速從model尋找最佳解的演算法
作者: arrenwu (鍵盤的戰鬼)   2016-11-06 02:28:00
我是覺得只要情報一樣,加上訓練資料夠多,電腦是應該要能夠贏過人腦的
作者: twosheep0603 (兩羊)   2016-11-06 02:29:00
人腦做的事情也一樣啊 整理情報 做對應動作只是deep learning把這個過程高度抽象化了啊其實好像不能說是抽象 對人類抽象但對數學具體
作者: arrenwu (鍵盤的戰鬼)   2016-11-06 02:31:00
你講的第六感說穿了是職業選手經驗的累積迅速解讀
作者: twosheep0603 (兩羊)   2016-11-06 02:33:00
第六感的賭某種意義上跟蒙地卡羅方法是一樣的XD
作者: kinghtt (萬年潛水伕)   2016-11-06 02:33:00
阿法狗下圍棋不是靠暴力演算破解…而是會整理可能性分支遊戲中的第六感就是玩家根據經驗法則歸納出的可能性
作者: twosheep0603 (兩羊)   2016-11-06 02:35:00
遇到經驗外的事件 人類跟電腦都一樣只能用猜的
作者: arrenwu (鍵盤的戰鬼)   2016-11-06 02:35:00
是啊,可以說是經驗啊,所以放招有可能取得很大成果但要看一個策略好不好,要看打幾千場下來的結果
作者: Heeida (....)   2016-11-06 02:35:00
圍棋是輪流,算出可能性還有對應時間,星海錯了大勢已去
作者: Sischill (Believe or not)   2016-11-06 02:36:00
你講的情形不管人腦電腦差別到底在哪? 遇到那種賭招的人腦一樣會跟電腦錯亂呀
作者: Heeida (....)   2016-11-06 02:36:00
的情況比較多吧,能屌打人類就表示電腦學會人的狡滑了..
作者: twosheep0603 (兩羊)   2016-11-06 02:36:00
電腦比人類強的優勢之一就是左右互搏幾千場是可能的也就是說所謂奇招對電腦來說可能也看過數百次
作者: kinghtt (萬年潛水伕)   2016-11-06 02:37:00
阿法狗上場前有自機對奕上千場累積經驗強化分支選擇
作者: twosheep0603 (兩羊)   2016-11-06 02:38:00
至於電腦學會狡猾 也要看狡猾能不能幫助它贏
作者: kinghtt (萬年潛水伕)   2016-11-06 02:39:00
所以對人類時阿法狗會下勝率最高的步數而不是暴力破解
作者: twosheep0603 (兩羊)   2016-11-06 02:39:00
總覺得原PO過分強調圍棋回合制與星海即時的差異了
作者: Heeida (....)   2016-11-06 02:40:00
光學會狡猾這件事在AI就是大突破了,這篇的主旨也是這吧..
作者: arrenwu (鍵盤的戰鬼)   2016-11-06 02:40:00
戰爭只有一次,但是星海可以打1000場啊
作者: kinghtt (萬年潛水伕)   2016-11-06 02:40:00
李世石比賽之後的對奕也學阿發狗走精算過的步數減少
作者: Heeida (....)   2016-11-06 02:41:00
圍棋得到的情報是100%正確的,能判斷假情報就比圍棋價值高
作者: kinghtt (萬年潛水伕)   2016-11-06 02:41:00
直覺式的下法…他也因此提高勝率
作者: arrenwu (鍵盤的戰鬼)   2016-11-06 02:41:00
你講的沒辦法預測對手放招,這不分人腦or電腦的
作者: twosheep0603 (兩羊)   2016-11-06 02:42:00
應該說是測驗對於不完全的資訊計算的能力吧
作者: Curapikt (StarLight Breaker!!)   2016-11-06 02:42:00
我指的是電腦要怎麼"思考"的演算法,之前工作上有接觸過
作者: Sischill (Believe or not)   2016-11-06 02:42:00
我覺得討論已經偏了 重點是人腦跟電腦的差異
作者: kinghtt (萬年潛水伕)   2016-11-06 02:43:00
阿法狗對人類最大的教育就是直覺非最嘉選擇…
作者: twosheep0603 (兩羊)   2016-11-06 02:43:00
另外電腦對於勝率高的概念跟人類絕對不一樣
作者: Curapikt (StarLight Breaker!!)   2016-11-06 02:43:00
自然語言學習的工具,它學習的過程並不是人去教他文法是
作者: arrenwu (鍵盤的戰鬼)   2016-11-06 02:43:00
預測對面會不會放招這不可能吧...根本沒有前兆啊
作者: Sischill (Believe or not)   2016-11-06 02:43:00
首先你說計中計中計中計, 電腦AI在學習時所有的replay都
作者: Curapikt (StarLight Breaker!!)   2016-11-06 02:44:00
什麼,它會自己找一套方法,但是怎麼"學習"還是有演算法
作者: kinghtt (萬年潛水伕)   2016-11-06 02:44:00
精算過的走法才是獲勝的最佳解
作者: arrenwu (鍵盤的戰鬼)   2016-11-06 02:44:00
他只要勝率比人類高,他就超越人類了
作者: Sischill (Believe or not)   2016-11-06 02:45:00
可以記錄下來 人腦不行, 那在策略上 人腦除非用電腦沒
作者: twosheep0603 (兩羊)   2016-11-06 02:45:00
實際上它不需要100%碾壓也能體現價值
作者: arrenwu (鍵盤的戰鬼)   2016-11-06 02:45:00
說穿了AI根本沒有所謂的「想到你要怎麼做」這種概念
作者: Sischill (Believe or not)   2016-11-06 02:46:00
人腦也是一樣的下場 所以跟本上來說人腦在RTS就沒有什麼
作者: kinghtt (萬年潛水伕)   2016-11-06 02:46:00
另外,勝率最高的步數代表輸的場次最少…
作者: jmss50894 (加味逍遙散)   2016-11-06 02:47:00
預測敵方單位從初始時間開始加機率像三路英雄消失沒視野 大概要進巴龍池
作者: w60904max (自宅警備隊員)   2016-11-06 02:49:00
結果是躲在草叢 準備BD主堡 XD
作者: kinghtt (萬年潛水伕)   2016-11-06 02:50:00
其實是起內鬨都龜溫泉放爛
作者: twosheep0603 (兩羊)   2016-11-06 02:50:00
那準備BD主堡的機率價值函數也會上升
作者: w60904max (自宅警備隊員)   2016-11-06 02:51:00
但探巴龍的勝率比較高 所以還是選了這步
作者: CactusFlower (仙人掌花)   2016-11-06 02:53:00
可是深度思考恐怖的地方就在於他學習的能力啊...
作者: arthurduh1 (arthurduh1)   2016-11-06 02:53:00
不會因為勝率高就固定選哪一步阿
作者: bndan (seed)   2016-11-06 02:53:00
還有一個點是原文有提的 就是"即時" 如果真讓AI在人類社會
作者: bndan (seed)   2016-11-06 02:54:00
更有貢獻 那這AI必須要能處理"即時"的事件
作者: twosheep0603 (兩羊)   2016-11-06 02:54:00
以剛剛那個探巴龍vs守家防BD的例子來說AI會在兩者各給出一個機率 然後靠機率做決策
作者: arrenwu (鍵盤的戰鬼)   2016-11-06 02:55:00
DeepLearning厲害是厲害在資料夠多一定會optimal
作者: twosheep0603 (兩羊)   2016-11-06 02:56:00
但不是哪邊機率最高就選哪邊 是機率高的容易被選中
作者: w60904max (自宅警備隊員)   2016-11-06 02:56:00
對 不過這點就跟DL無關了
作者: kmchao33 (有點累)   2016-11-06 03:22:00
比星海是要比加速好嗎
作者: Murasaki0110 (麥當勞歡樂送)   2016-11-06 03:28:00
別神話DL好嗎...解不好的問題還一堆SGD一定會optimal大家也不用tune半天參數了
作者: KenWang42 (KenWang42)   2016-11-06 03:49:00
這個時代 人人都能嘴出一套演算法
作者: Khadgar (Khadgar)   2016-11-06 04:39:00
這樣星海算是NP問題嗎?
作者: HappyKH (KH)   2016-11-06 05:52:00
想到阿法狗的未來是戰爭用途總覺得毛毛的
作者: hsiehhsing (海諧會會員)   2016-11-06 06:27:00
總算有非單細胞的人了,阿法狗要突破的就是預測的障礙而不是單單的運算勝率結果一堆人只看操作,但沒思考光有操作能贏比賽嗎
作者: max199083 (阿盟)   2016-11-06 06:34:00
不用太高估星海的決策複雜度
作者: ultratimes   2016-11-06 07:00:00
電腦光散兵,人根本散不贏 人類只能一小坨拉開
作者: lugiam (Anashisu)   2016-11-06 07:26:00
在生物界 最狡猾的就是人類 無人能出其右
作者: hsiehhsing (海諧會會員)   2016-11-06 07:36:00
捧那麼高,明年去挑戰阿法狗阿,bz會放APIDeepMind 在 APM 上將有所限制,確保雙方的對戰是公平google團隊都已經聲明了,呵呵 不知道在捧阿法狗的人有什麼想法
作者: hyk32166 (了了了)   2016-11-06 08:13:00
覺得有操作就能贏應該沒玩過吧XD
作者: w3160828 (kk)   2016-11-06 08:22:00
講的好像有微操 阿法狗靠工兵能吃掉整團兵
作者: orze04 (orz)   2016-11-06 08:26:00
看過年初那篇論文 星海你要怎得到value network?
作者: satheni (看到羊就想睡..)   2016-11-06 08:31:00
電腦的演算法會有一個判定哪個做法效益值最高的解但是星海2你要如何判定這個解,考驗的不只是電腦,還有工程師,而且那個微操基本上跟開掛沒兩樣就別提了
作者: kira925 (1 2 3 4 疾風炭)   2016-11-06 08:34:00
你看到那些微操 其實都是作弊的
作者: satheni (看到羊就想睡..)   2016-11-06 08:34:00
如果不是取得內部資料,怎麼可能精準算出距離多少
作者: kullan (Welcome to Hentai-wan)   2016-11-06 09:04:00
在太多未知的條件下 電腦要贏星海電競選手難度遠比圍棋高如果比的都是200人口對戰 那當然不可能贏AI
作者: brianzzy (BK)   2016-11-06 09:15:00
這讓我想到尼特羅會長在自爆前對蟻王說 別小看人類的惡意
作者: ColdLeafOwl (冷葉鴞)   2016-11-06 09:19:00
個人覺得避免使用"狡猾"這種詞來形容AI比較適當畢竟是不同的東西 過於直覺地嘗試理解可能會認知偏差關於選擇勝率高的作法也值得討論單純這麼做的話 搭配的即時資訊判讀 會不會反而什麼都沒做到? 也就是沒有一套有明確目的的戰術這個還請有完星海的版友解惑了 小弟沒有真正接觸過
作者: icerany   2016-11-06 09:45:00
回樓上,玩家在打星海時也是靠探查到的情報下去做應對但這情報不一定是真的,有可能是對方的騙局
作者: smart0eddie (smart0eddie)   2016-11-06 09:46:00
微操微操微操 沒指令哪來微操
作者: icerany   2016-11-06 09:47:00
你選則勝率高的戰術也是人之常情
作者: smart0eddie (smart0eddie)   2016-11-06 09:47:00
圍棋回合制時間都不夠燒 即時制來的及下整體戰術?
作者: Mchord (Mchord)   2016-11-06 09:52:00
個人心得,DL是因為一些演算法使得大型NLP模型的參數可求
作者: A1pha ([αλφα])   2016-11-06 09:53:00
推推
作者: Mchord (Mchord)   2016-11-06 09:53:00
解吧,覺得不用設計演算法,或AI懂"學習"甚至不用數學都有點太過於商業宣傳了input現在有機會透過數學模型對應到抽象的output才是真的
作者: linzero (【林】)   2016-11-06 09:58:00
可是電腦可以打防守拼微操,敵人打來以微操來用低耗損來換單位。所以也不太需要戰術,用一定模式生產單位即可。
作者: kira925 (1 2 3 4 疾風炭)   2016-11-06 09:59:00
BW的話是這樣 SC2的操作差距有限
作者: linzero (【林】)   2016-11-06 10:04:00
因阿法狗的機制好像是隨機行動,留下勝率高的行為,再以這範圍繼續隨機,一直重複取得勝率高的模式。學習當中遇到各種戰術,最終應該是會以其微操優勢為核心發展出應對機制。所以有可能初期是以多路單兵騷擾為輔發展自身為主到後期兵夠了一整波海過去。或者是初期就拼微操打快攻
作者: tsubasawolfy (悠久の翼)   2016-11-06 10:10:00
Deepmind是要訓練戰爭策略。想想真實世界戰爭資源都量化,配上美軍正在發展的無人攻擊機跟無人艦。以後局部戰爭誰要跟他打。
作者: penut85420 (PenutGGorz)   2016-11-06 10:15:00
終於有理智人出來說話了
作者: MoMovincent (MoMoTea)   2016-11-06 10:53:00
教主:偵查?開天眼通就好了阿
作者: awfulday (糟糕的一天 櫻雨綿綿)   2016-11-06 11:04:00
還有人在玩sc喔??
作者: alankira (小艾)   2016-11-06 11:11:00
...本文不錯,但你後面的論點我覺得有點流於情感闡述了
作者: shinwind (風)   2016-11-06 11:43:00
其實我一直覺得 到底有多少人有資訊背景然後可以輕鬆說出電腦必勝可能在未來的某一天是這樣沒錯!但是打星海這件事情 有太多因素同時在判斷沒錯 對於人類來說確實很簡單.但是放到電腦的領域根本完全不一樣更何況是非常即時的運算!我意思是幾分鐘內出現的大量可能性
繼續閱讀
[閒聊] 一覺醒來發現蝙蝠俠和超人互換身體會如何than09138[問題] 智乃都是怎麼尿尿的?cpblgu[16秋] 長騎美眉04sleepmageRe: [新聞] 暴雪結合DeepMind人工智慧 開發星海爭霸2dulinoveRe: [新聞] 暴雪結合DeepMind人工智慧 開發星海爭霸2NerVGearRe: [問題] 像白箱這樣邊播邊畫正常嗎?Xavy[創作] 你的名字觀後感furato[開箱] 槍彈辯駁3BDII(全系列雷)kingbalanceRe: [[email protected]

Links booklink

Contact Us: admin [ a t ] ucptt.com