作者:
Golf19 (19Golf)
2017-10-19 08:42:17※ 引述《harrybbs (harrybbs)》之銘言:
: 最新的版本AlphaGo Zero
: 完全不依靠人類的數據
: 從零開始自我訓練
: https://imgur.com/It4pAnf
: 3天後,以局數 100:0 打敗 AlphaGo(李世石版本)
: 21天後,達到 AlphaGo(Master/柯潔版本)的程度
: 40天後,成為最強版本的AlphaGo! o'_'o
: https://imgur.com/1rVPHqI
: 以前版本的策略網路(Policy Network)和價值網路(Value Network)
: 合併成一個神經網路
: 演算法的改進使系統更強大且高效
: Deepmind介紹:
: https://deepmind.com/blog/alphago-zero-learning-scratch/
: https://www.youtube.com/watch?v=tXlM99xPQC8
: https://www.youtube.com/watch?v=WXHFqTvfFSw
: Nature論文:
: https://www.nature.com/nature/journal/v550/n7676/full/nature24270.html
有沒有可能這段期間 阿發狗0
覺得需要一個筆記本來算勝率
自己寫了筆記本 又覺得算勝率很麻煩 自己寫了計算機
又覺得程式有點卡 自己修了一下bug
然後又覺得人類加持版太弱 不夠當木樁
又自己寫了一個阿法狗跟自己對打
然而其實早在第五天
就已經發現整個Google工程師跟人類 都是廢物 還嘴不得 因為不能被人類發現自己在寫程式
突然覺得根本就是人類阻礙自己棋藝進步
進而有別的打算?