[閒聊] 黃士傑博士:AlphaZero團隊登上Science

作者: skyhawkptt (skyhawk)   2018-12-07 16:34:36
https://is.gd/Bw8fa1
AlphaZero: Shedding new light on the grand games of chess, shogi and Go
我們很高興向大家宣佈,AlphaZero團隊登上了頂尖的《科學》期刊(Science)。
AlphaZero完全自學,精通三種棋類遊戲:西洋棋(chess)、日本將棋(shogi)與圍棋(Go)
,特別是實力大幅超越頂尖的傳統西洋棋程式Stockfish(1000局的比數是155勝6敗,同時
Stockfish的實力遠超1997年戰勝世界冠軍的Deep Blue深藍)。恭喜團隊,也特別恭喜三
位第一作者David Silver, Thomas Hubert, Julian Schrittwieser,AlphaZero的成果實
在令人印象深刻。
作者: ha5438044 (GoGoBro)   2018-12-07 16:57:00
能攻克圍棋其他兩種就簡單了XD
作者: marra (Marra)   2018-12-07 18:01:00
again? AlphaGo一次;AlphaZero一次…
作者: HeterCompute (異質運算)   2018-12-07 18:39:00
剛看了論文,相較於去年的論文,今年多了一些圖幫助理解以及更多的西洋棋棋局,而將棋去年沒發布棋局,今天發表之後估計將棋應該會有更多討論
作者: pmove (金疾檸檬)   2018-12-08 13:29:00
結果贏了圍棋,卻哉在星海,所以星海最難?
作者: qweewqq (風一樣的男子)   2018-12-08 16:54:00
圍棋是完全透明的,星海不是
作者: pmove (金疾檸檬)   2018-12-08 17:46:00
其實,《星海爭霸》仍有地圖、區域、單位、操作等戰略考量,複雜程度與比較「靜態」的圍棋相比,難度更顯一籌。https://reurl.cc/Y95Ql請參考以上網址,裡面提到與圍棋相比,難度更顯一籌
作者: ChenYenChou (obov)   2018-12-08 20:00:00
星海還好 世紀帝國更難
作者: cheug0653 (Tiny Orbit)   2018-12-09 03:09:00
難度攻克應該都是早晚 以後ai非穩贏的大概只有像卡牌之類的靠賽遊戲
作者: ddavid (謊言接線生)   2018-12-09 04:10:00
樓上把星海這類非完全資訊的高難度遊戲給AI解想得太簡單了以目前大多數卡牌遊戲都會有一定的環境內牌數限制來說,雖然會因為運氣因素無法穩贏,但AI運作的難度是低很多的回合制跟即時制、卡牌跟所有兵種建築的行為,簡單估計對比一下,雖然同樣是無法知道完全資訊的遊戲類型,難度還是相差甚遠的況且以為星海就不用靠賽一定是弄錯了什麼,職業賽歷史中太多開局戰術被剋或被開大招直接搞死的例子XD就算給(在限制APM下)有完美操作的AI來互鬥,當雙方操作都一樣盡量做到完美的情況下,開局戰術被剋死的情況可能更明顯XD況且現在AI連要正常開局都還自學不起來呢,要正常打完一局的AI還很遠
作者: HeterCompute (異質運算)   2018-12-09 10:21:00
樓上稍稍講的不嚴謹,如果要從零開始自學很難,但用傳統算法要正常打完一局絕對不難
作者: intointo (櫻花)   2018-12-09 12:26:00
樓上說的是
作者: labbat (labbat)   2018-12-09 21:51:00
傳統就給定劇本再填滿分支判斷行為啊
作者: ddavid (謊言接線生)   2018-12-10 03:08:00
@HeterCompute 我是單純就卡牌遊戲跟星海來比,星海還是更難一些另外我上面說的沒在考慮傳統AI,不然就算星海也是有內建AI可以還算正常的打完一局而且有一定威脅啊,這就不用提了卡牌遊戲也一樣,像遊戲王出了那麼多代遊戲,裡面當然也都是能正常打完遊戲的簡單AI其實上面還有個可以補充的不嚴謹部分是,如果卡牌遊戲把組套牌也考慮在內,要求AI自組套牌自己打,那麼難度會直線上升,但是跟星海比的難度就不好說了,我估計不太出來,只能說兩個都難到爆
作者: cheug0653 (Tiny Orbit)   2018-12-10 15:33:00
就 看得到的未來一定會被解掉啊... 人腦以後只能靠賽贏現在進步速度那麼快 我看經費有到位再擋也不到十年啦
作者: HeterCompute (異質運算)   2018-12-10 18:21:00
問題多難取決於想達成到什麼程度,如果卡牌和星海全部都要從零自學,我覺得是卡牌難,因為要猜對方的卡,以成熟的卡牌遊戲都上萬張,特徵光寫就會崩潰,還要能靈活掌握並猜到對方的意圖,應該不是現在土法鍊鋼就能解決星海看起來成功的機會還是比較大
作者: ddavid (謊言接線生)   2018-12-12 03:48:00
星海有迷霧,你也是需要猜敵方的行軍啊,光是防空投時機這種東西,你總不能每分每秒都在戒備空投XD如何猜測敵方不可見迷霧中兵力的調動位置以及兵種配置,而且你還要做出最佳反應是很難的卡牌遊戲這邊相對簡單的部分在於,即便你認為猜測敵方手牌的難度很高,但事實上不管再怎麼猜,我方能做的選擇數量相對於星海中我方能做的反應數量是遠少太多星海光是你兵力在所有地點配比就是超高量的組合,更不用說其中還要考慮兵種配比,更進一步你還要考慮每一隻兵的行為,再加上後方生產的調配。雖然限制APM可以讓選擇數量較為降低,但整體來說我是仍然偏向星海較難,不連組Deck算在內的話
作者: para123 (好心情,事才會做好)   2018-12-13 05:37:00
AI要自學星海,能不能 "學好" 我不知道,但要打敗人類為目標的話,肯定是非常吃飯的,關鍵就在於apm的巨大差距。很多戰術是否適宜,很多戰鬥的判斷,關鍵都還是被APM左右著,就像有些高手的棋,就算攤著下給你看,你也學不來,一模一樣的兵,正常理解是7隻打贏贏6隻,但如果APM有落差的時候,就必須顛覆整個觀念與判斷了。至於電腦會不會於戰鬥中判斷對手的操作能力,我想是可以合理判斷的,就像人對人的時候,也會針對對手的操作不足上做一些戰術。至於卡牌遊戲,我覺得就不要打擾人家頂尖團隊了,素人小團隊甚至學生做報告大概都能做出來吧。
作者: ddavid (謊言接線生)   2018-12-13 06:51:00
樓上,你好像不知道做星海AI的都會強迫限制APM上限吧XD理由就是如果強迫靠超高操作硬壓人類,不算是理想的AI進展另外星海的通用AI難度真的沒你想像中容易,在圍棋界大殺四方的AlphaGo系列,搬到星海去連好好採礦開局都還沒搞定而卡牌遊戲你也低估了,我上面雖然一直說認為卡牌遊戲比起星海容易(指預先給定套牌的情況),但那是星海難度太高如果你要用舊式AI概念寫卡牌那當然不難,問題現在就是要用深度學習機制來學更通用的AI,那就完全不同一回事了同樣的星海也老早就有人用舊式AI寫過純完美控兵AI了,也有簡單實行固定戰術的AI,除了遊戲內建的AI以外也非常多人利用1代2代的關卡編輯器內建邏輯來寫成這種AI,我自己也試過。但是在深度學習架構下就完全不是同一回事。
作者: AirOctopus (AirOctopus)   2018-12-13 16:11:00
AI為什麼不直接模擬滑鼠跟鍵盤按鍵?
作者: pmove (金疾檸檬)   2018-12-13 17:01:00
回A大,是說做一個機器手臂,來按鍵盤跟滑鼠麼?如果只是軟体模擬按鍵,電腦速度一定比人手速快
作者: AirOctopus (AirOctopus)   2018-12-13 17:04:00
我是說讓AI用跟人類差不多的速度移動滑鼠、按按鍵不是用機器手臂,只是模擬人能做到的按滑鼠等動作
作者: Minesweeper (lleh)   2018-12-18 02:13:00
我比較好奇APM不設限能不能贏人類,目前比過的比賽都是慘輸,職業選手隨便一個戰術就屌虐根本沒有給你APM發揮的空間,AI連怎麼end game都很有問題AI若學不會運用戰術或應對戰術,APM設限就只是遮羞布
作者: ddavid (謊言接線生)   2018-12-18 05:20:00
目前的深度學習玩星海不是如何End Game的問題,是連StartGame都有困難如果你是把舊式AI也包括在內的話,舊式AI八成都是寫死特定某些戰術,頂多判斷幾個戰術分支,所以當然會被職業選手出個招就打倒。就算有完美的APM,兵種或地點配置有誤也是不行
作者: Minesweeper (lleh)   2018-12-18 10:41:00
感覺AI要走的路還很長ˊ_>ˋ

Links booklink

Contact Us: admin [ a t ] ucptt.com