Fw: [FB] 黃士傑: 11月10日 人工智慧年會的演講

作者: staristic (ANSI lover)   2017-10-19 14:10:22
※ [本文轉錄自 Gossiping 看板 #1Pw3U84F ]
作者: SangoDragon (SANGO) 看板: Gossiping
標題: [FB] 黃士傑: 11月10日 人工智慧年會的演講
時間: Thu Oct 19 13:26:28 2017
FB卦點說明:黃士傑將在11月10日,人工智慧年會的演講
介紹AlphaGo Zero的精彩故事
FB連結: https://www.facebook.com/aja.huang
FB內容:
大家好,我們很高興與大家分享AlphaGo的第2篇論文,非常榮幸AlphaGo團隊再次登上了世
界頂尖的《自然》雜誌。
11月10日在人工智慧年會的演講,我也將介紹AlphaGo Zero的精彩故事。
這篇論文介紹了AlphaGo Zero,也就是完全脫離人類知識的AlphaGo版本。主要成果如下:
- AlphaGo Zero從零開始自我學習下圍棋。
- 僅僅36小時後,AlphaGo Zero靠著自我學習,就摸索出所有基本且重要的圍棋知識,達到
了與李世石九段對戰的AlphaGo v18的相同水平。
- 3天後,AlphaGo Zero對戰AlphaGo v18達到100%的勝率。
- 不斷進步的AlphaGo Zero達到了Master的水平。Master即年初在網路上達成60連勝的
AlphaGo版本。
- 40天後,AlphaGo Zero對戰Master達到近90%勝率,成為有史以來AlphaGo棋力最強的版本
雖然AlphaGo Zero沒有公開下過棋,在論文中我們附上了AlphaGo Zero的80局棋(選自不同
階段的自我學習,
https://www.nature.com/…/v5…/n7676/extref/nature24270-s2.zip),供大家研究。從
圍棋技術的角度來說,AlphaGo Zero自學所發現的圍棋觀念,例如打劫、征子、棋形、開局
先下在角部,開局定式等等,絕大部分與人類的圍棋觀念是一致的,這也間接呼應了人類幾
千年以來圍棋研究的價值。AlphaGo Zero的棋風特別好戰,並且也喜歡直接點33。從論文內
容來說,這主要是一篇強化學習的論文,關鍵技術在於強化學習訓練pipeline的效能極大化

針對這篇論文或AlphaGo想要提問的朋友,請參加明天的AlphaGo AMA,AlphaGo團隊的
David Silver與Julian Schrittwieser將在線以英文回答大家的問題。
https://www.reddit.com/…/ama_we_are_david_silver_and_julia…/
時間是 10月19號英國時間晚上6點 (台灣時間 10月20日凌晨一點)
作者: cerberi (cerberi)   2016-10-19 13:28:00
強者的宿命 就是戰呀
作者: soaping (撿肥皂ing)   2016-10-19 13:28:00
幹 超神 只要告訴他遊戲規則 就能發展出超猛戰法
作者: aCCQ (阿賢)   2016-10-19 13:30:00
甚麼時候公開挑戰即時戰略遊戲選手阿
作者: sampsonhugh (夏)   2016-10-19 13:31:00
對Google任建言請善用此信箱 https://goo.gl/dRTU4E
作者: aaaba (小強)   2016-10-19 13:49:00
作者: staristic (ANSI lover)   2016-10-19 13:55:00
可以借轉Go嗎?
作者: zzzz8931 (肥宅)   2016-10-19 13:57:00
作者: shadow0326 (非議)   2016-10-19 14:00:00
好戰AI的興起,人類GG
作者: zeat (L.)   2017-10-19 14:29:00
無師自通也太強@@
作者: Yibooo ( )   2017-10-19 14:43:00
沒受人類汙染的版本 開局依舊下在很正常的地方沒出現什麼5-5、邊星、天元之類的 人類應該感到很欣慰啊
作者: staristic (ANSI lover)   2017-10-19 14:54:00
如果出現那種奇葩開局還能虐Master應該會更有趣XDDD
作者: s891234 (嘟嚕咑)   2017-10-19 15:00:00
不知道無污染版本可不可能有原本沒有的弱點><
作者: yys310 (有水當思無水之苦)   2017-10-19 15:04:00
好想聽演講...
作者: cubec (cubec)   2017-10-19 15:26:00
http://tinyurl.com/y8z2l6db AlphaGo Zero的80局對弈棋譜
作者: ddavid (謊言接線生)   2017-10-20 03:05:00
@s891234 理論上當然有可能,無人類棋譜並不代表它就不會落到某些局部最佳解,但是以學習速度來說人類還是難以抓到事實上它對於Master也沒到100%勝率就證明了仍有可被Master抓到的缺點

Links booklink

Contact Us: admin [ a t ] ucptt.com