[討論] 阿發狗要繁殖小baby了?

作者: aaaba (小強)   2016-03-12 16:37:59
跟樊麾下的阿發狗是吃KGS的棋譜長大的
後來跟小李下的時候,大概是吃了職棋的正式對局譜,又變得更猛
前兩階段可以說是以人的心血餵養長大的,還有點血脈相承的親切感
但剛剛聽柯潔那台的棋評提到
接下來會把人的影子都清洗淡化,
也就是純粹的用阿發狗自己對局的棋譜來重學下棋
這種完完全全丟掉初始資料的學習方式個人是第一次聽聞
(相較於後續只是接著 fine-tuning 的作法)
有夠變態!
不知道有沒有人可以找到資料來源?
作者: BRANFORD (請保佑我的父親)   2016-03-12 16:40:00
他自己的棋譜已經是前無古人的境界了 還吃別人的幹嘛?
作者: hdjj (hdjj)   2016-03-12 16:42:00
有新聞說AI會自己對下,所以成長的速度比我們想像還要更快
作者: a741085 (向前一鏢)   2016-03-12 16:43:00
阿就散功的概念阿
作者: ming1053 (ming)   2016-03-12 16:44:00
今天的賽前訪問 deepmind 成員自己說的有提早半小時看官方直播的人應該都會聽到
作者: darkseer   2016-03-12 16:45:00
我就想不通為什麼要用原始的SL策略網路和rollout policy
作者: deicide218 (軟軟)   2016-03-12 16:46:00
學棋的話 還是用高永夏的棋譜最好了 哈哈哈哈
作者: NaoGaTsu (那歐卡茲)   2016-03-12 16:46:00
因為阿發狗的棋力目前已經遠高於人類,這代表官方認為
作者: darkseer   2016-03-12 16:46:00
而不是建立好RL之後再重新建立一次SL。
作者: darkseer   2016-03-12 16:47:00
提問XD,那雜訊是希望"不多不少"嗎?(希望我沒有誤解paper...)
作者: micotosai (日本語が半人前の俺様)   2016-03-12 16:49:00
他是亂馬嘛?還無差別格鬥流哩
作者: coldlian (荀文若)   2016-03-12 16:53:00
散功啦
作者: darkseer   2016-03-12 17:11:00
可是paper裡好像只有用人類棋譜來建立SL策略網路,儘管它其實可以重新用訓練好的AlphaGo重建。當然這也可能是因為寫paper時AlphaGo還不夠強啦,不過他們的paper好像是說希望有某種被人類篩選過的雜訊。It is worth noting that the SL policy network per-formed better in AlphaGo than the stronger RL policynetwork, presumably because humans select a diversebeam of promising moves, whereas RL optimizes forthe single best move.今天的賽前訪問我聽的感覺像是在闡述人工智慧的前景和研發方向,不太記得是不是有特別指圍棋@@嗯對我想錯了其實不是同一件事XD,至少paper也沒解釋為
作者: lwei781 (nap til morning?)   2016-03-12 17:35:00
像無名散功重練 更上一層啊
作者: darkseer   2016-03-12 17:35:00
什麼不用『AlphaGo棋譜建立的SL來重新建立RL value』至於MCTS本身不用RL policy就像你說是另一件事。那部分paper的說明倒是比較好想像XD
作者: tn00371115 (二代目月光仙子)   2016-03-12 18:01:00
有喔 會有學習極限的事
作者: profyang (prof)   2016-03-12 18:29:00
我也是覺得會有學習極限的事 我現在還是傾向於相信圍棋上帝讓兩子 而阿發夠可能就很像集合世上各大高手的優點或許中及型態可以讓到柯潔這種當世第一讓到分先終極
作者: chieya (chieya)   2016-03-12 20:19:00
感覺像洗血統,要洗到精純
作者: waiter337 (給開司一罐蘇格登)   2016-03-12 21:35:00
反過來說,說不訂雜訊都阿法狗自己洗的,人類:去洗雜訊!成就:[學會洗雜訊]

Links booklink

Contact Us: admin [ a t ] ucptt.com