[情報]DeepMind宣布更強的AlphaGo算法

作者: wadashi1 (阿拉丁)   2019-12-31 00:17:47
一個月前的新聞了
冥冥天意:李世石退役 DeepMind宣布更強的AlphaGo算法
原文網址:https://kknews.cc/tech/zyojoql.html
11月19日,韓國棋院宣布,李世石九段辭去職業棋手職務,正式宣布退役。在與AlphaGo
的第一次人機大戰當中,李世石神奇的一挖,成就了人類與AlphaGo唯一的勝局。
或許是天意,就在昨天,谷歌的DeepMind再次發表論文,宣布推出全新的算法MuZero,通
過這一算法,可以加快人工智慧的訓練速度。目前在圍棋、西洋棋、將棋以及數十個
Atari遊戲的學習表現當中優於目前所有算法,具體到圍棋上,已經可以超越之前的
AlphaZero。
==============================================
另一個說明MuZero的網頁:
https://www.chainnews.com/zh-hant/articles/175196541080.htm
通用 AlphaGo 誕生?DeepMind 的 MuZero 在多種棋類遊戲中超越人類
DeepMind 近期的一項研究提出了 MuZero 算法,該算法在不具備任何底層動態知識的情
況下,通過結合基於樹的搜索和學得模型,在雅達利 2600 遊戲中達到了 SOTA 表現,在
國際象棋、日本將棋和圍棋的精確規劃任務中可以匹敵 AlphaZero,甚至超過了提前得知
規則的圍棋版 AlphaZero。
==============================================
就在大家都說deepmind的AlphaGo已退役,不可能再出來,什麼都是張飛打岳飛!
殊不知,Deepmind依然繼續再研究,再次超越Alphazero的新演算法MuZero再次橫空出現!
就在李世石和leelazero相繼表明退休及結束訓練的這時候。
要不要讓張飛可以跟岳飛打,決定權在Deepmind,祖師爺不想跟徒子徒孫打也沒辦法。
AlphaZero是在既定規則下訓練出來會下圍棋。
MuZero據說層次更高,在沒有規則下..由人類誘導下,發明了圍棋,又成為棋聖!
希望MuZero可以在讓子棋上有更強大的發揮!
作者: kenwufederer (Nash)   2019-12-31 00:40:00
期待棋譜
作者: rnoro (隼)   2019-12-31 03:57:00
不過deepmind的文章中好像沒有說MuZero超越AlphaZero,我想他的意思是在學習的效率上可以匹配(match),但文章的的圖表中並沒有表明MuZero的棋力更高明~事實上在figure 3A中,MuZero在長期的表現中還是稍稍輸給AlphaZero
作者: aegis43210 (宇宙)   2019-12-31 04:45:00
話說Leela被bjiyxo大續命後,目前又卡關了
作者: HeterCompute (異質運算)   2019-12-31 09:00:00
強是強在通用,棋力應該沒有更高明
作者: abc0922001 (中士abc)   2019-12-31 09:12:00
現在 bjiyxo 還在努力要給 LZ續命!
作者: pan0531 (= =")   2018-01-01 00:48:00
樓上從何處得知的消息[email protected]@
作者: maplefoxs (狐狸怎麼叫)   2018-01-01 13:39:00
效率更高 是不是代表不用那麼強的硬體
作者: abc0922001 (中士abc)   2018-01-01 15:06:00
http://zero.sjeng.org/ Test Matches 的 Table滑鼠移到權重那邊會顯示資訊
作者: pan0531 (= =")   2018-01-01 20:20:00
又出更強的權重了...bjiyxo大好猛
作者: lwei781 (nap til morning?)   2018-01-01 22:35:00
liminf 還是重點啊
作者: intointo (櫻花)   2018-01-03 08:40:00
演算效率提升吧?

Links booklink

Contact Us: admin [ a t ] ucptt.com