Re: [心得] AI對戰人類心得(已補影片)

作者: x94fujo6   2017-11-04 08:02:45
想說的有點多
如果版主覺得不適合發在本版可以刪除 沒意見
每次有AI相關的東西
就會發現很多人的觀念還停留在上個世紀
以為AI就是寫好寫死的固定程式
這次比賽的AI
前兩個應該是屬於上面這種
第三個AI很明顯有點類似AlphaGo
有一些比較"非人類"的動作
10年前跟你說AI可以打贏圍棋世界冠軍
99%的人都會笑著說怎麼可能
現在?
目前最好的AI
所做的各種判斷/應對
都不是由人類設計/輸入/寫好的
而是由AI自己不斷"演化"的結果
所以會有一些"非人類"操作是非常正常的事情
不懂的可以看看這影片
我下面會說明
只要幾分鐘你就能大概理解這種AI
https://www.youtube.com/watch?v=NHtsUls3AnY
這是一個超級簡單到不行的AI模擬
首先
所有AI都擁有一樣的 "身體"
但每個AI都有自己的移動方式
這個方法最一開始是隨機設定的
所以會有很多根本不知道在幹三小的AI 很正常
再來是這種AI的關鍵
演化的條件
要設定甚麼條件才能演化出更"好"的AI
在這個模擬中
要的是能夠盡可能的快速吃到 "食物"(紅點) 的AI
當一個AI能夠吃到食物就能產生基於自己的 "後代"
一直吃不到/搶不贏的...就是死亡/淘汰
"後代" 雖然大部分的移動方式和 "前代" 一樣
但會有一些小部分可以產生隨機的變化
(想成DNA複製錯誤產生的突變就懂了)
這個變化可能有好有壞
能更快的吃到食物→ 這個AI就能產生更多的"後代"
反而動作變慢→ 這不好的演化結果會慢慢被前者淘汰
最後
你會得到一群搶食物快得嚇人的AI
這跟大自然的物競天擇有87%像
"自然演化" 就是一個非常強大的演算法
可以想成類似暴力破解
嘗試近乎無數的可能性後找出好的解法

"演化" 和 "暴力破解" 最大的不同在於
演化並不需要每一次嘗試都 "從0開始"
而是建立在"前代"的成功之上逐漸改進
最後的結果可能不是真正最好的解決方法
但至少非常非常非常接近
這種AI的特性是
裡面到底發生了啥
就算是設計的人都得研究一下才能知道
而且也只是"當下"的情況
多跑幾次模擬後可能又不一樣了
對外界來說就是個 "黑箱"
就像電腦自己教會自己一樣 (基本上 真的是)
https://www.youtube.com/watch?v=op0bhZNUJFE
這個內部運作的程式
應該也是模擬出來的AI
四隻腳=同時協調大量元件運作
受到外力能自行恢復平衡
加上負載後重心變化後要怎麼應對
人寫的出來你敢信?
隨便一個動作就要花很多時間
而且87%無法動的和AI一樣完美
AI模擬連實機都不需要
直接在電腦上一次模擬數十數百個
不需要人介入(其實還是要 調整各種條件等等)
就能自己演化出來
參數設的好 → AlphaGo
參數設的不好 → 垃圾/改參數重來
只會4D的AI
很可能是因為天梯環境
天梯在幹嘛?
不就是以最高勝率的戰術獲得最多勝場?
當AI發現4D勝率很高然後只以這個戰術為基準的時候
整個訓練方向就錯了
如果訓練AI時用的是職業選手
那結果應該會很不一樣
https://www.youtube.com/watch?v=hx_bgoTF7bs
這個也是
初期看起來真的很好笑 (有如這次表演的AI)
但理論上演化夠多次後
AI會比 "你" 還懂得如何 "正確的" 走路...
純粹分享一些業餘的知識
如有錯誤歡迎討論
作者: capssan (Miracle)   2017-11-04 08:24:00
這算是類神經的概念嗎 好奇問一下而已
作者: jayfrog (寫不出coding)   2017-11-04 08:26:00
演化計算是ai的一種沒錯,但是不是每種ai都是演化計算吧
作者: jackfantasy (jackfantasy)   2017-11-04 08:29:00
1樓是的 現在大部分AI都有類神經網路在裡面 也就是常聽到的neural network其實對AI來說 所謂的學習 是去逼近如果你願意相信 則其實世界上所有的事物都可以轉化對應成一個數學函數 可能很複雜 可能很簡單y=ax+bAI的概念就是我不知道a,b但是我從一堆資料裡面去逼近出a,b是什麼 學到這個f(x)然後接下來你給我x我一定可以預測出y所以才說訓練資料很重要 如果你的訓練資料有偏頗 或是太少 他根本無法逼近出真正的那個f(x) 就會變成預測很爛 很不准 或是打很爛 但這就是他從資料中學到的類神經也就是neural network 做的就是我用一堆神經元來讓AI可以逼近超複雜 不只是a b兩個參數 而是上萬個參數的函數
作者: sartan (sartan)   2017-11-04 08:40:00
Festo這是什麼公司阿?也太可怕,默默開放出這些可怕玩意
作者: capssan (Miracle)   2017-11-04 09:02:00
如果是這樣 圍棋跟星海對他們來說資料量差太大了吧幾乎多個參數就多好幾倍的變化
作者: jackfantasy (jackfantasy)   2017-11-04 09:10:00
星海跟AlphaGo用的呢是neural mdtwork的一個分支 叫做reinforcement learning 強化學習一樣是逼近找出數學函數 但是這個數學函數表示的是一個叫做「決策」的條件機率 也就是AI「觀察」到現在這個「狀態」 然後決定要做什麼「動作」每一個「動作」會得到「獎勵」 目標是使得整局比賽獎勵最大對啊 這參數量真的很大 因此要在學習過程懂得刪減掉機率太小的決策以減少計算 而且訓練過程需要的電腦數量至少幾千幾萬台 時間也要四、五個月
作者: Timba (踢音霸)   2017-11-04 10:17:00
學習能力啦~ 還有邏輯判斷 能不能用現有的資訊預測其他狀況
作者: kirimaru73 (霧丸)   2017-11-04 10:33:00
參數量超超超超大 所以之前的年代這不是主流作法現在因為GPU強到翻 大家發現它足以撐起這麼誇張的計算量所以才一窩蜂開始發展現在的這種作法 是真的相當於在開發一顆大腦出來但這顆大腦確實只會做一種事情(然而也可以幹爆人類)所以要說這是弱人工智慧並非真的智慧 也是有其道理推文提到的ax+b就是類神經網路的 但十幾年前的技術大概只會使用1024/2048這種量級的ax+b所以被當成玩具現在則是約100x100x1000+4096+4096這種程度的數量另外如果考慮AI競賽或人機大戰 沒人規定你不能用腳本你有本事就用 只是現在用了會被業餘玩家幹爆而已(遊戲內腳本強是因為他作弊)
作者: sampp1213205 (佛朗Sam哥)   2017-11-04 18:55:00
然而 依然一堆原始人在小看Ai
作者: x61s (x61series)   2017-11-04 19:54:00
樓上最好說清楚點,Sen應該不算原始人,AI行為搞笑自然會被放大檢視甚至輕視,現在輕視也不代表會一直輕視
作者: win4104 (BB)   2017-11-04 20:33:00
現在明明就還有很多問題待克服我不覺得把將來的可能性拿到現在來反對其他人對當前成果的批判 是什麼有意義的事
作者: kirimaru73 (霧丸)   2017-11-04 20:44:00
這一版AI被笑是完全合情合理的 4D+2這種戰術以玩家的角度來看本來就該笑 當然會長成這種戰術確實有研究上的原因和討論價值 不過SEN他播報是播給遊戲玩家看的那當然要站在玩家的立場來解說 沒什麼好批評的
作者: sampp1213205 (佛朗Sam哥)   2017-11-04 20:48:00
白痴 在講的是小看ai的可能性跟強大好爆zzz
作者: kirimaru73 (霧丸)   2017-11-04 20:49:00
嘩 不服氣就砲白癡 這點真的比AI強太多了
作者: x61s (x61series)   2017-11-04 20:54:00
我們已經進入網路時代,資訊交流是以秒為單位傳遞今天嘲笑AI的人 在AI蛻變後 往往也是最早讚揚AI的人
作者: win4104 (BB)   2017-11-04 20:57:00
再說 雖然在很多篇已經說過了DeepMind最近發表的研究狀況是他們卡關了為什麼還是看到很多人講的好像 演算法問題都已經解決只需要給AI時間學習一樣
作者: x61s (x61series)   2017-11-04 20:58:00
無需以先知者的態度來諷刺,這個時代沒有先知,人人都是先知
作者: Butcherdon (Donald)   2017-11-04 21:01:00
好像以前摸過的基因演算法不過那時候休課只是入門 沒接觸複雜度 設定好進化條件和突變種類之類的東西 讓程式演化n代自動找出某種棋盤排列 人很難排出的東西 電腦只要兩三秒
作者: jackfantasy (jackfantasy)   2017-11-04 23:13:00
其實笑是正常的 如果身為懂AI的人更該高興 因為你正在目睹市場被教育Google DeepMind比起征服圍棋有另一個更大的重點跟使命-教育市場 為未來的AI產業開拓市場 越多人瞭解AI本質 就越能接受他 使用他 為他付費Google更是在大家都不懂AI是什麼時 透過征服圍棋 讓大家有了Google是AI產業領導品牌的形象比起下圍棋 這是更大的一步棋所以何必笑或是生氣外人看不懂AI 當你是第一個教育市場的人 你就賺錢了 這也許是台灣產業和專家、工程師該學的
作者: x61s (x61series)   2017-11-05 00:13:00
很簡單 因為說的人往往非產業中人 酸民很少是深度涉入者ai是否被接受 這些酸民都只能旁觀 選擇當先知酸人相對實際
作者: APM99 (血統純正台北人)   2017-11-05 06:12:00
不小看這次AI的 叫做對AI有太多幻想好久沒看到白癡這兩個字了 好猛3b1b 這幾天把AI的視頻也都給丟上youtube了 有興趣了解的這些AI天梯勝率有達到70%嗎 天梯有前十嗎 沒有嘛還有連單位都不用圈選的 根本作弊 就搞笑來的還請到司令出征wwwww
作者: ernova831   2017-11-05 11:29:00
連新手都打不贏的採礦AI到底能幹嘛zzz
作者: jackace (inevitable......)   2017-11-05 12:32:00
我覺得先弄懂MDP和POMDP的limit在哪裡再說吧
作者: iamten (小騰)   2017-11-05 15:59:00
這ai打一人般勝率很高 4d戰術很強 一般人不會對應打職業就吃屎吧靠硬操作贏的那種也不叫AI還有AI演算法很早就有了 這幾年強是硬體進步了但是星海是動態 跟圍旗是靜態完全不一樣

Links booklink

Contact Us: admin [ a t ] ucptt.com