激戰二十天!人工智慧 Libratus 戰勝四位頂級德州撲克選手
https://www.inside.com.tw/2017/01/31/libratus
在賓州匹茲堡的 Rivers 賭場,卡耐基梅隆大學(CMU)開發的人工智慧系統 Libratus
戰勝四位德州撲克頂級選手,獲得最終勝利。
據官網介紹,此次由 4 名人類職業玩家 Jason Les、Dong Kim、Daniel McAulay 和
Jimmy Chou 對戰人工智慧程式 Libratus,賽程為 20 天,一共進行了 12 萬手牌的比賽
。
2015 年,CMU 曾組織了首場「大腦對抗人工智慧」賽事。在當時的賽事中,代表 CMU 出
戰的是另外一款人工智慧系統「Claudico」,同樣也有 4 名職業撲克玩家參加了比賽,
然而,Claudico 並未獲得最終勝利。
不過 CMU 認為,當時撲克職業玩家與 Claudico 僅進行了 8 萬手牌的比賽,就統計學角
度來講並無法證明人類職業撲克玩家或人工智慧具有優勢。這也是本輪巡迴賽中比賽的牌
局數量增加 50% 的原因。
德州撲克的玩法:每個玩家有 2 張牌作為「底牌」,同時還有 5 張公共牌。玩家選擇 5
張公共牌裡的 3 張,與手裡的 2 張底牌組合,最後以期得到最好的 5 張牌的組合。按
照「Card Ranking」決定最後的勝者。
由於對方的「底牌」是隱藏資訊,對於電腦來說,就是在處理一種「非完整資訊博弈」。
而圍棋對弈雙方的資訊是完整的、對稱的,並沒有隱藏的資訊。Libratus 此次戰勝頂級
人類德州撲克選手,具有非常重要的意義。
電腦正確決定,依賴於對方「底牌資訊」情況下的機率分佈,這種「底牌資訊」可以通過
對手過去的行為顯露出來。比如有時玩家採取「虛張聲勢」(Bluffing)的策略,對手有
時手裡並沒有強牌,但還是作出全額下注、志在必得的行為,電腦這時要根據對方過去的
博弈表現,來判斷對手有強牌的機率。
相應的,對手也會推斷我方的底牌資訊,所以這裡就是一個「遞歸推理」(recursive
reasoning),一個玩家無法輕易推理博弈狀況。
繼圍棋和德州撲克之後,人工智慧的下一站會是哪個遊戲呢?