想說的有點多
如果版主覺得不適合發在本版可以刪除 沒意見
每次有AI相關的東西
就會發現很多人的觀念還停留在上個世紀
以為AI就是寫好寫死的固定程式
這次比賽的AI
前兩個應該是屬於上面這種
第三個AI很明顯有點類似AlphaGo
有一些比較"非人類"的動作
10年前跟你說AI可以打贏圍棋世界冠軍
99%的人都會笑著說怎麼可能
現在?
目前最好的AI
所做的各種判斷/應對
都不是由人類設計/輸入/寫好的
而是由AI自己不斷"演化"的結果
所以會有一些"非人類"操作是非常正常的事情
不懂的可以看看這影片
我下面會說明
只要幾分鐘你就能大概理解這種AI
https://www.youtube.com/watch?v=NHtsUls3AnY
這是一個超級簡單到不行的AI模擬
首先
所有AI都擁有一樣的 "身體"
但每個AI都有自己的移動方式
這個方法最一開始是隨機設定的
所以會有很多根本不知道在幹三小的AI 很正常
再來是這種AI的關鍵
演化的條件
要設定甚麼條件才能演化出更"好"的AI
在這個模擬中
要的是能夠盡可能的快速吃到 "食物"(紅點) 的AI
當一個AI能夠吃到食物就能產生基於自己的 "後代"
一直吃不到/搶不贏的...就是死亡/淘汰
"後代" 雖然大部分的移動方式和 "前代" 一樣
但會有一些小部分可以產生隨機的變化
(想成DNA複製錯誤產生的突變就懂了)
這個變化可能有好有壞
能更快的吃到食物→ 這個AI就能產生更多的"後代"
反而動作變慢→ 這不好的演化結果會慢慢被前者淘汰
最後
你會得到一群搶食物快得嚇人的AI
這跟大自然的物競天擇有87%像
"自然演化" 就是一個非常強大的演算法
可以想成類似暴力破解
嘗試近乎無數的可能性後找出好的解法
但
"演化" 和 "暴力破解" 最大的不同在於
演化並不需要每一次嘗試都 "從0開始"
而是建立在"前代"的成功之上逐漸改進
最後的結果可能不是真正最好的解決方法
但至少非常非常非常接近
這種AI的特性是
裡面到底發生了啥
就算是設計的人都得研究一下才能知道
而且也只是"當下"的情況
多跑幾次模擬後可能又不一樣了
對外界來說就是個 "黑箱"
就像電腦自己教會自己一樣 (基本上 真的是)
https://www.youtube.com/watch?v=op0bhZNUJFE
這個內部運作的程式
應該也是模擬出來的AI
四隻腳=同時協調大量元件運作
受到外力能自行恢復平衡
加上負載後重心變化後要怎麼應對
人寫的出來你敢信?
隨便一個動作就要花很多時間
而且87%無法動的和AI一樣完美
AI模擬連實機都不需要
直接在電腦上一次模擬數十數百個
不需要人介入(其實還是要 調整各種條件等等)
就能自己演化出來
參數設的好 → AlphaGo
參數設的不好 → 垃圾/改參數重來
只會4D的AI
很可能是因為天梯環境
天梯在幹嘛?
不就是以最高勝率的戰術獲得最多勝場?
當AI發現4D勝率很高然後只以這個戰術為基準的時候
整個訓練方向就錯了
如果訓練AI時用的是職業選手
那結果應該會很不一樣
https://www.youtube.com/watch?v=hx_bgoTF7bs
這個也是
初期看起來真的很好笑 (有如這次表演的AI)
但理論上演化夠多次後
AI會比 "你" 還懂得如何 "正確的" 走路...
純粹分享一些業餘的知識
如有錯誤歡迎討論