※ 引述《sgps (鄭議子)》之銘言:
: 標題:AlphaGo贏了圍棋 下一步挑戰卡牌遊戲
: 來源:自由時報
: 〔即時新聞/綜合報導〕日前Google Deepmind團隊所研發的人工智慧AlphaGo挑戰圍棋,
: 成功擊敗韓國棋王李世石,許多人好奇在挑戰圍棋成功後下一步在哪,有報導指出,屬於
: 電競產業的《爐石戰記》將是他們努力的方向之一。
: 之前曾有報導指出,Google Deepmind團隊希望AlphaGo能挑戰暴雪公司(Blizzard)旗下
: 的戰略遊戲《星海爭霸》,但他們顯然並不引以為滿,據《TechRepublic》報導,卡牌遊
: 戲也是他們想要挑戰的目標,其中《爐石戰記》與《魔法風雲會》是他們會率先嘗試的兩
: 款遊戲。
: 報導指出,Google Deepmind團隊的研發人員正在努力編寫程式,讓AlphaGo挑戰這兩款卡
: 牌遊戲,但顯然他們想和人類高手對戰,還有很多路要走,目前還在努力讓AlphaGo能解
: 讀卡片能力的階段而已,而且目前為止不是很成功。
: Google Deepmind團隊在報導中指出,他們的目的不是以機器人取代人類,而是希望能與
: 人類攜手重新定義人類。
: 而《爐石戰記》普遍被認為是人類能讓AlphaGo吃盡苦頭的遊戲之一,並不是因為卡牌遊
: 戲的複雜度與難度,而是遊戲裡面充斥的大量隨機系統,「運氣」並非電腦AI能掌控,玩
: 家有時只能做出最好的選擇,計算最高的機率,但結果不一定盡如己意。在洛杉磯舉辦的
: 亞太區冠軍資格賽中,台灣選手Pinpingho連續兩天以些微差距獲勝,選手技術十分精湛
: ,也多少靠著天助自助。
: 剛忘記附來源 補來源:http://news.ltn.com.tw/news/life/breakingnews/1645148
: 心得:阿發購懂甚麼叫靠賽嗎?
: 心得2:報導內文有國平今天比賽的圖XD
小魯工程師
之前有稍微看過AlphaGo的運算邏輯
作為一款卡牌遊戲
很多人可能會想他要怎麼理解卡片內文之類的
可是我認為
「根本不需要」
首先先來講AlphaGo本身的運算策略
主要建構於SL和RL兩種
初步學習是用SL
意指在某局面下,人類職業棋手最有可能下在哪裡
基於這樣的狀況去模仿職業棋手下棋
但因為這樣永遠不可能超越職業棋手
所以會有RL策略
透過不斷跟自己下棋建立更優秀的下棋權重
AlphaGo本身嚴格來說
並不知道為什麼要這樣下
只知道這樣下勝率最高
卡牌遊戲也是同理
他可以透過SL模仿職業選手出牌
再透過RL自我對戰進化
他甚至根本不用理解規則文
我想現在惟一需要克服的就只有RNG
以往職業對戰都會有放手一駁到最後翻盤的例子
(也就是賭到那個極低的勝率)
但在AlphaGo不一定會有這種選擇
我還滿期待他會怎麼呈現的XD