Fw: [情報] AlphaZero戰勝將棋與西洋棋最強軟體 asglay PTT批踢踢實業坊

Fw: [情報] AlphaZero戰勝將棋與西洋棋最強軟體

作者: asglay (收收收尾) 2017-12-07 00:15:41

※ [本文轉錄自 GO 看板 #1Q9-Ito- ]
作者: HeterCompute (異質運算) 看板: GO
標題: [情報] AlphaZero戰勝將棋與西洋棋最強軟體
時間: Wed Dec 6 20:38:11 2017
https://arxiv.org/pdf/1712.01815.pdf
這次論文的標題是：
Mastering Chess and Shogi by Self-Play with a
General Reinforcement Learning Algorithm
從零學棋，
使用相似的神經網路架構，
一樣沒有使用任何人類知識，
4小時打敗西洋棋最強軟體Stockfish，
2小時打敗將棋最強軟體Elmo，
34小時打敗圍棋AlphaGoZero 20blocks 3天版本，
(圍棋其實有些爭議，因為他這次用了5000TPU，上次AlphaGoZero只用2000TPU)，
以MCTS打倒傳統的alpha beta search，
通用於完全訊息遊戲，
又一偉大的突破。

作者: staristic (ANSI lover) 2016-12-06 20:45:00

一個通用於下棋的AI？

作者: tetratio (徹拉修) 2016-12-06 20:50:00

又達到新境界了

作者: BBSealion (海獅) 2016-12-06 20:54:00

不知道限制多嚴格，有運氣成分的（例如暗棋）或多人的（例如跳棋）不知道能否通用過去

作者: birdy590 (Birdy) 2016-12-06 20:55:00

力王：大家可以回家啦~

作者: harrybbs (harrybbs) 2016-12-06 20:59:00

逆天啦發展這麼快

作者: dongy (孤星...) 2016-12-06 21:01:00

暗棋可以計算機率的,但因複雜度不高,且有部分運氣,所以人類棋手會有一定勝率

作者: TWN2 (.....) 2016-12-06 21:04:00

想看阿法零跟赤木茂打麻將

作者: zeat (L.) 2016-12-06 21:06:00

AlphaGO老師：我是說在座的各位都是＿＿

作者: aegis43210 (宇宙) 2016-12-06 21:15:00

已經征服完全訊息遊戲了，希望星海二也會有突破

作者: s891234 (嘟嚕咑) 2016-12-06 21:41:00

真的是在座的各位都是哈哈，可以回家啦~~~

作者: Lordaeron (Terry) 2016-12-06 21:43:00

多人跟雙人是有很多不同,沒問題就有鬼囉.

作者: turing (涂妮) 2016-12-06 22:22:00

這也終結了西洋棋的西西里防禦。

作者: MonkeyCL (猴總召) 2016-12-06 22:35:00

這世界變化太快好累啊

作者: hne (hne ) 2016-12-06 22:52:00

太強了 O o

作者: asglay (收收收尾) 2016-12-07 00:11:00

借轉chess

作者: ssccg (23) 2017-12-07 00:35:00

雖然演算法很強，但是真的有資源能玩更是關鍵...不知道在電王的規則下多強就是了

作者: lwei781 (nap til morning?) 2017-12-07 01:43:00

應該差不多強耗資源的部分是訓練

作者: ssccg (23) 2017-12-07 02:30:00

實戰用的是4TPU，先不說電王沒TPU，TPU是CPU的幾十倍吧?64T vs 4TPU感覺不算公平，當然再多訓練下去一定是Alpha強

作者: NewYAWARA (朝霞之前奏) 2017-12-07 10:11:00

請他們明年到電王戰比一次就知道了，現在的elmo也不是最強，而且大家有被限制統一硬體規格

作者: fossil313 (陣雨) 2017-12-07 12:25:00

跟StockFish每秒搜尋7000k比 AlphaZero只有搜尋80k感覺應該是沒什麼懸念了

作者: ssccg (23) 2017-12-07 12:58:00

在一個node上要做的evaluation不同，不能比NPS吧AlphaZero比較強是一定的，只是好奇TPU優化的程式用4TPU跑要改寫成一般CPU能跑的話會是要多少CPU才有同樣強度

作者: NewYAWARA (朝霞之前奏) 2017-12-07 20:16:00

後來測試最新tanuki確實是比elmo強

作者: kcl0801 (kcl) 2017-12-08 13:10:00

新電王ぽんぽこ近日直播時正式上線被日本觀眾嫌的要死xd因為預測的太短視剛上直播時常常只預測下一步昨天看時好一點可是在畫面上有預測後9步的空間却完美的只預設了8步空一格...

作者: ssccg (23) 2017-12-08 13:52:00

那是UI和探索引擎配合的問題吧

繼續閱讀

[將棋] 羽生善治奪取龍王達成永世七冠壯舉NewYAWARA [它棋] 以棋會友，有人對下象棋有興趣嗎(增人)a10120108 Re: [西洋] 請問棋局為何莫名結束了？LukeForward [閒聊] 小型棋類變體的流行程度Neisseria [西洋] 卡斯帕洛夫的手錶china2025 在日本，圍棋和西洋棋的流行程度shimanda019 [將棋] 洋化的將棋表示法Neisseria Re: [問題] 西洋棋變體創作請教Neisseria [將棋] 有關子力評估的疑問Neisseria [約戰] 日本將棋十月棋聚kenny359259