Fw: [情報] AlphaZero戰勝將棋與西洋棋最強軟體

作者: asglay (收收收尾)   2017-12-07 00:15:41
※ [本文轉錄自 GO 看板 #1Q9-Ito- ]
作者: HeterCompute (異質運算) 看板: GO
標題: [情報] AlphaZero戰勝將棋與西洋棋最強軟體
時間: Wed Dec 6 20:38:11 2017
https://arxiv.org/pdf/1712.01815.pdf
這次論文的標題是:
Mastering Chess and Shogi by Self-Play with a
General Reinforcement Learning Algorithm
從零學棋,
使用相似的神經網路架構,
一樣沒有使用任何人類知識,
4小時打敗西洋棋最強軟體Stockfish,
2小時打敗將棋最強軟體Elmo,
34小時打敗圍棋AlphaGoZero 20blocks 3天版本,
(圍棋其實有些爭議,因為他這次用了5000TPU,上次AlphaGoZero只用2000TPU),
以MCTS打倒傳統的alpha beta search,
通用於完全訊息遊戲,
又一偉大的突破。
作者: staristic (ANSI lover)   2016-12-06 20:45:00
一個通用於下棋的AI?
作者: tetratio (徹拉修)   2016-12-06 20:50:00
又達到新境界了
作者: BBSealion (海獅)   2016-12-06 20:54:00
不知道限制多嚴格,有運氣成分的(例如暗棋)或多人的(例如跳棋)不知道能否通用過去
作者: birdy590 (Birdy)   2016-12-06 20:55:00
力王:大家可以回家啦~
作者: harrybbs (harrybbs)   2016-12-06 20:59:00
逆天啦 發展這麼快
作者: dongy (孤星...)   2016-12-06 21:01:00
暗棋可以計算機率的,但因複雜度不高,且有部分運氣,所以人類棋手會有一定勝率
作者: TWN2 (.....)   2016-12-06 21:04:00
想看阿法零跟赤木茂打麻將
作者: zeat (L.)   2016-12-06 21:06:00
AlphaGO老師:我是說在座的各位都是__
作者: aegis43210 (宇宙)   2016-12-06 21:15:00
已經征服完全訊息遊戲了,希望星海二也會有突破
作者: s891234 (嘟嚕咑)   2016-12-06 21:41:00
真的是在座的各位都是哈哈,可以回家啦~~~
作者: Lordaeron (Terry)   2016-12-06 21:43:00
多人跟雙人是有很多不同,沒問題就有鬼囉.
作者: turing (涂妮)   2016-12-06 22:22:00
這也終結了西洋棋的西西里防禦。
作者: MonkeyCL (猴總召)   2016-12-06 22:35:00
這世界變化太快好累啊
作者: hne (hne )   2016-12-06 22:52:00
太強了 O o
作者: asglay (收收收尾)   2016-12-07 00:11:00
借轉chess
作者: ssccg (23)   2017-12-07 00:35:00
雖然演算法很強,但是真的有資源能玩更是關鍵...不知道在電王的規則下多強就是了
作者: lwei781 (nap til morning?)   2017-12-07 01:43:00
應該差不多強 耗資源的部分是訓練
作者: ssccg (23)   2017-12-07 02:30:00
實戰用的是4TPU,先不說電王沒TPU,TPU是CPU的幾十倍吧?64T vs 4TPU感覺不算公平,當然再多訓練下去一定是Alpha強
作者: NewYAWARA (朝霞之前奏)   2017-12-07 10:11:00
請他們明年到電王戰比一次就知道了,現在的elmo也不是最強,而且大家有被限制統一硬體規格
作者: fossil313 (陣雨)   2017-12-07 12:25:00
跟StockFish每秒搜尋7000k比 AlphaZero只有搜尋80k感覺應該是沒什麼懸念了
作者: ssccg (23)   2017-12-07 12:58:00
在一個node上要做的evaluation不同,不能比NPS吧AlphaZero比較強是一定的,只是好奇TPU優化的程式用4TPU跑要改寫成一般CPU能跑的話會是要多少CPU才有同樣強度
作者: NewYAWARA (朝霞之前奏)   2017-12-07 20:16:00
後來測試最新tanuki確實是比elmo強
作者: kcl0801 (kcl)   2017-12-08 13:10:00
新電王ぽんぽこ近日直播時正式上線 被日本觀眾嫌的要死xd因為預測的太短視 剛上直播時常常只預測下一步 昨天看時好一點 可是在畫面上有預測後9步的空間 却完美的只預設了8步空一格...
作者: ssccg (23)   2017-12-08 13:52:00
那是UI和探索引擎配合的問題吧

Links booklink

Contact Us: admin [ a t ] ucptt.com