作者:
asglay (收收收尾)
2017-12-07 00:15:41※ [本文轉錄自 GO 看板 #1Q9-Ito- ]
作者: HeterCompute (異質運算) 看板: GO
標題: [情報] AlphaZero戰勝將棋與西洋棋最強軟體
時間: Wed Dec 6 20:38:11 2017
https://arxiv.org/pdf/1712.01815.pdf
這次論文的標題是:
Mastering Chess and Shogi by Self-Play with a
General Reinforcement Learning Algorithm
從零學棋,
使用相似的神經網路架構,
一樣沒有使用任何人類知識,
4小時打敗西洋棋最強軟體Stockfish,
2小時打敗將棋最強軟體Elmo,
34小時打敗圍棋AlphaGoZero 20blocks 3天版本,
(圍棋其實有些爭議,因為他這次用了5000TPU,上次AlphaGoZero只用2000TPU),
以MCTS打倒傳統的alpha beta search,
通用於完全訊息遊戲,
又一偉大的突破。
作者:
staristic (ANSI lover)
2016-12-06 20:45:00一個通用於下棋的AI?
不知道限制多嚴格,有運氣成分的(例如暗棋)或多人的(例如跳棋)不知道能否通用過去
作者:
birdy590 (Birdy)
2016-12-06 20:55:00力王:大家可以回家啦~
作者:
harrybbs (harrybbs)
2016-12-06 20:59:00逆天啦 發展這麼快
作者:
dongy (孤星...)
2016-12-06 21:01:00暗棋可以計算機率的,但因複雜度不高,且有部分運氣,所以人類棋手會有一定勝率
作者:
TWN2 (.....)
2016-12-06 21:04:00想看阿法零跟赤木茂打麻將
作者:
zeat (L.)
2016-12-06 21:06:00AlphaGO老師:我是說在座的各位都是__
作者: s891234 (嘟嚕咑) 2016-12-06 21:41:00
真的是在座的各位都是哈哈,可以回家啦~~~
作者:
turing (涂妮)
2016-12-06 22:22:00這也終結了西洋棋的西西里防禦。
作者:
hne (hne )
2016-12-06 22:52:00太強了 O o
作者:
asglay (收收收尾)
2016-12-07 00:11:00借轉chess
作者:
ssccg (23)
2017-12-07 00:35:00雖然演算法很強,但是真的有資源能玩更是關鍵...不知道在電王的規則下多強就是了
作者:
lwei781 (nap til morning?)
2017-12-07 01:43:00應該差不多強 耗資源的部分是訓練
作者:
ssccg (23)
2017-12-07 02:30:00實戰用的是4TPU,先不說電王沒TPU,TPU是CPU的幾十倍吧?64T vs 4TPU感覺不算公平,當然再多訓練下去一定是Alpha強
請他們明年到電王戰比一次就知道了,現在的elmo也不是最強,而且大家有被限制統一硬體規格
跟StockFish每秒搜尋7000k比 AlphaZero只有搜尋80k感覺應該是沒什麼懸念了
作者:
ssccg (23)
2017-12-07 12:58:00在一個node上要做的evaluation不同,不能比NPS吧AlphaZero比較強是一定的,只是好奇TPU優化的程式用4TPU跑要改寫成一般CPU能跑的話會是要多少CPU才有同樣強度
作者:
kcl0801 (kcl)
2017-12-08 13:10:00新電王ぽんぽこ近日直播時正式上線 被日本觀眾嫌的要死xd因為預測的太短視 剛上直播時常常只預測下一步 昨天看時好一點 可是在畫面上有預測後9步的空間 却完美的只預設了8步空一格...
作者:
ssccg (23)
2017-12-08 13:52:00那是UI和探索引擎配合的問題吧