[FB] 黃士傑 11/10人工智慧年會介紹AlphaGo Zero 開發過程

作者: jkkert   2017-10-20 10:55:59
FB卦點說明:(繁體中文 20 個字)
黃博士:
11月10日在人工智慧年會的演講,我也將介紹AlphaGo Zero的精彩故事。
(中略......)
AlphaGo Zero對戰Master達到近90%勝率,
成為有史以來AlphaGo棋力最強的版本。
FB連結:
https://goo.gl/kDKy99
FB內容:
大家好,我們很高興與大家分享AlphaGo的第2篇論文,非常榮幸AlphaGo團隊再次登上了
世界頂尖的《自然》雜誌。
11月10日在人工智慧年會的演講,我也將介紹AlphaGo Zero的精彩故事。
這篇論文介紹了AlphaGo Zero,也就是完全脫離人類知識的AlphaGo版本。主要成果如下

- AlphaGo Zero從零開始自我學習下圍棋。
- 僅僅36小時後,AlphaGo Zero靠著自我學習,就摸索出所有基本且重要的圍棋知識,達
到了與李世石九段對戰的AlphaGo v18的相同水平。
- 3天後,AlphaGo Zero對戰AlphaGo v18達到100%的勝率。
- 不斷進步的AlphaGo Zero達到了Master的水平。Master即年初在網路上達成60連勝的
AlphaGo版本。
- 40天後,AlphaGo Zero對戰Master達到近90%勝率,成為有史以來AlphaGo棋力最強的版
本。
雖然AlphaGo Zero沒有公開下過棋,
在論文中我們附上了AlphaGo Zero的80局棋
(選自不同階段的自我學習,https://goo.gl/Q7nUHS ),
供大家研究。
從圍棋技術的角度來說,AlphaGo Zero自學所發現的圍棋觀念,例如打劫、征子、棋形、
開局先下在角部,開局定式等等,絕大部分與人類的圍棋觀念是一致的,這也間接呼應了
人類幾千年以來圍棋研究的價值。
AlphaGo Zero的棋風特別好戰,並且也喜歡直接點33。
從論文內容來說,這主要是一篇強化學習的論文,關鍵技術在於強化學習訓練pipeline的
效能極大化。
針對這篇論文或AlphaGo想要提問的朋友,請參加明天的AlphaGo AMA,AlphaGo團隊的
David Silver與Julian Schrittwieser將在線以英文回答大家的問題。
https://goo.gl/Vo2qoZ
※ 臉書爆卦請用FB當標題,並附上20繁體中文說明卦點,違者水桶一個月。
※ 注意!濫用FB爆卦視同鬧板文處理。
※ 記得要附上來源網址。
作者: snowrain (無心之償有心茲勤)   2017-10-20 10:57:00
土條核廢料放你家(大誤)
作者: chadmu (查德姆)   2017-10-20 10:58:00
分類啦
作者: abc0922001 (中士abc)   2017-10-20 10:58:00
對戰Master到90%,是怎樣...
作者: obdv (真☆母★教右護法)   2017-10-20 11:00:00
馬的SAI又進化啦
作者: SnakeO (ha)   2017-10-20 11:02:00
輸的10%是之前摸索階段輸的嗎@@?
作者: fire124 (Jack The Ripper)   2017-10-20 11:03:00
只是宅男,別怕
作者: goldduck (哥達鴨)   2017-10-20 11:04:00
在過幾天 100%
作者: scott0002 (sc)   2017-10-20 11:10:00
3天人類累積的所有圍棋知識被從0創造 可見未來進步會有的喔快速
作者: ECZEMA (加油!)   2017-10-20 11:18:00
AI 學東西特別快 應該可以在數學上作大突破
作者: aaaba (小強)   2017-10-20 11:24:00
op
作者: schumi7401 (死蚊子給我出來)   2017-10-20 11:32:00
Master人類就贏不了了zero還屌打 那人類還玩個屁
作者: goldduck (哥達鴨)   2017-10-20 11:35:00
早就是低等生物了
作者: moonlind (又多了敷臉卡跟覓食卡了~)   2017-10-20 11:47:00
AI神奇的地方就在這裡 例如看一個人的臉就能知道他的星座 說不定都辦得到 問題是人根本不知道他如何辦到

Links booklink

Contact Us: admin [ a t ] ucptt.com