※ 引述《harrybbs (harrybbs)》之銘言:
: 最新的版本AlphaGo Zero
: 完全不依靠人類的數據
: 從零開始自我訓練
: https://imgur.com/It4pAnf
: 3天後,以局數 100:0 打敗 AlphaGo(李世石版本)
: 21天後,達到 AlphaGo(Master/柯潔版本)的程度
: 40天後,成為最強版本的AlphaGo! o'_'o
: https://imgur.com/1rVPHqI
: 以前版本的策略網路(Policy Network)和價值網路(Value Network)
: 合併成一個神經網路
: 演算法的改進使系統更強大且高效
: Deepmind介紹:
: https://deepmind.com/blog/alphago-zero-learning-scratch/
: https://www.youtube.com/watch?v=tXlM99xPQC8
: https://www.youtube.com/watch?v=WXHFqTvfFSw
: Nature論文:
: https://www.nature.com/nature/journal/v550/n7676/full/nature24270.html
這個版本讓我覺得
阿法狗已經到達了圍棋界獨孤求敗的境界
獨孤求敗曾在劍塚留下
紫薇軟劍,30歲所用,誤傷少林掃地僧,悔恨無己,棄之山谷。
40歲後,不滯於物,草木竹石皆可為劍。自此精修,漸進於無劍勝有劍之境。
現在的zero
就是無劍勝有劍的最佳描繪阿!