[情報] 柯潔和deepmind檢討人機大戰

作者: HeterCompute (異質運算)   2017-09-15 19:25:32
大家好,今天我們很高興向大家公布AlphaGo與柯潔九段烏鎮峰會比賽的三個覆盤研究視
頻。在這三個視頻中,樊麾老師分享了大量AlphaGo的想法與思路,以及AlphaGo形勢判斷
的勝率,對於柯潔九段的一些問題與見解,雙方也針對AlphaGo在現場即時給出的下法有
許多探討與研究。為了讓世界各地的圍棋愛好者都能看懂這三個視頻,我們也特別加上了
英文字幕。
需要說明的是,視頻中參與覆盤的AlphaGo與烏鎮峰會比賽的版本和硬體配置(搭配4個TPU
的單機版)完全一樣。希望大家享受這三盤精彩的對局,也能從這三個視頻的覆盤研究中
有所收穫。祝大家觀影愉快。
Youtube
Game 1: https://youtu.be/HIu9P9wEIsc
Game 2: https://youtu.be/SF486mbvAOI
Gamd 3: https://youtu.be/CUZxe7bXKxo
以上轉貼自Aja臉書
以下心得
第一盤:
如果柯潔下的時候看的到勝率2% 3%的掉,可能每一盤眼淚都要掉出來了。
這真的是觀念上天與地的差距......
第二盤:
根本完全在AlphaGo的掌控之中,一點都沒有接近。
驚人的戰鬥力,可怕的形勢判斷,一絲不苟的次序,一點缺點都沒有。
Not even close.
第三盤:
瞬間崩潰QQ
作者: RicFlair (Figure-four Leglock!!)   2017-09-15 19:31:00
先推再說XD
作者: vicissitudes (無白)   2017-09-15 19:56:00
推!!!
作者: abc0922001 (中士abc)   2017-09-15 20:08:00
我在柯潔微博有看到XD
作者: depo (depo)   2017-09-15 20:39:00
推!!!
作者: jaw13 (jaw)   2017-09-15 21:22:00
先推再看
作者: hochirijay (uni)   2017-09-15 21:55:00
作者: oldTim (TIME WILL TELL)   2017-09-15 22:40:00
終於出了!先推再看
作者: za755188   2017-09-16 00:11:00
一手掉5% 兩手掉10%.....
作者: ddavid (謊言接線生)   2017-09-16 00:31:00
推推
作者: ztdxqa (ztdxqa)   2017-09-16 01:10:00
先推 週末再看
作者: gamania10000 (自助旅行中)   2017-09-16 01:33:00
柯潔穿白色好看.沒鹿晗運動季那時那麼腫了
作者: KINGTIGERX (細雨 河畔 擺渡人)   2017-09-16 07:13:00
作者: Eric0605 (我還有點餓)   2017-09-16 07:29:00
作者: semihumanity (沙漠之狐)   2017-09-16 08:05:00
推!
作者: sarraya (~ No Game No Life ~)   2017-09-16 11:11:00
作者: ztdxqa (ztdxqa)   2017-09-16 15:37:00
看完了 滿震撼的 原本以為(人類觀點)很接近的第二個局一點機會都沒有 根本不是當初所想只差一個劫材@@
作者: jacklin2002   2017-09-16 16:45:00
哇~推推!!
作者: wadashi1 (阿拉丁)   2017-09-16 17:03:00
這....Alphago這麼強,那以後還背什麼歷史的棋局,以後通通研究Alphago的自我對戰棋譜就好了.. 唉...
作者: ddavid (謊言接線生)   2017-09-16 19:06:00
樓上概念完全錯啦,因為你研究AlphaGo自戰只會看到一堆人類看不懂或就算看懂也沒有同等計算能力可以應用的下法柯潔跟樊麾影片中都不斷提到了,看AlphaGo下棋只是拓寬你的思路,但事實上你是不可能學AlphaGo下棋的,人類最終還是要用人類能掌握的下法
作者: ilw4e (可以吃嗎?)   2017-09-16 20:00:00
第二局是真的很近阿,電腦也一直顧慮著那個劫,結果問題竟然是在右邊的幾手處理上變成敗著
作者: abc0922001 (中士abc)   2017-09-16 20:24:00
你研究AlphaGo的棋譜,某師母又要發FB酸你了
作者: nanlong (懶龍)   2017-09-16 22:49:00
人類如果有AlphaGo那樣計算力~大概可樂勝。
作者: Yibooo ( )   2017-09-16 23:48:00
話說某盜版頻道太猛了竟然盜這3盤xdddd他不知道原版是發在deepmind官方頻道上嗎xd
作者: saladim (殺拉頂)   2017-09-16 23:53:00
讀一波 練一波 超爆幹強職棋二
作者: CGary (下雨天也挺浪漫的)   2017-09-17 01:23:00
第二戰是"前段"很接近 處理到一定程度後柯潔就沒戲了...研究AG的自戰棋譜會完全不知道AG為甚麼這樣下 跟我們一開始學棋就只看曠世奇局一樣 學到的很有限 可能是完全看不懂
作者: aegis43210 (宇宙)   2017-09-17 02:26:00
第一戰下個幾手,厚勢就消失了,學到好多
作者: dudu5566 (仁甫哥超MAN!!!)   2017-09-17 13:18:00
希望有中文字幕版 柯潔講話好糊又小聲 聽的好辛苦
作者: qqq1397 (渾汲噩營)   2017-09-17 13:49:00
樊講的超爛不提。重點是他手上的筆電應該就是Alphago可家用版本:設60s跟長時間樹不一樣,一步搜下十手、跟每步搜樹也不同,應該不只是資料庫這麼簡單
作者: RicFlair (Figure-four Leglock!!)   2017-09-17 13:50:00
兩人說話聲音很小 但笑聲超大XD
作者: saulesmeitas (太陽女)   2017-09-17 14:12:00
應該是他們有時候會離麥太遠…
作者: staristic (ANSI lover)   2017-09-17 14:20:00
聲音問題是麥克風不在他們嘴邊,當他們身體前傾就大聲往後倒到沙發上就小聲
作者: oldTim (TIME WILL TELL)   2017-09-17 15:02:00
這期的流程中因為常有等待Alpha搜的閒置時間略顯鬆散了些如果把中間搜的時間剪掉,多搜一些變化會更好
作者: ilw4e (可以吃嗎?)   2017-09-17 15:32:00
第二局總共就155手,100多手都還持平硬要講成"前段"XD樊勝率都告訴你了,大概就是右邊100多手後的處理崩掉了
作者: ulycess (ulycess)   2017-09-17 17:19:00
第二盤中間還是60:40,中間兩三手瞬間變成70:30
作者: AirOctopus (AirOctopus)   2017-09-17 18:34:00
(各手數勝率) https://i.imgur.com/7n5sedq.png第二盤黑棋55手時"挽回"開局劣勢,56手後開始佔優87手黑佔優但白仍可下,107手白大劣,109手分出勝負照樊麾說詞,勝率40~60 = 差不多,(開局55的白棋,跟據自戰是76%勝率,我想那60大概是88%之類的吧。)超過70代表贏定了(最後根據michael redmond的情報,AlphaGo現在最新版已經比柯潔版更新好幾代了,以勝率看讓先柯版應該可行
作者: HeterCompute (異質運算)   2017-09-17 19:04:00
我猜michael唬爛,現在除了deepmind沒人知道alphago有沒有再繼續訓練
作者: AirOctopus (AirOctopus)   2017-09-17 19:12:00
Michael有問deepmind的人,他現在在做AlphaGo自戰解說
作者: HeterCompute (異質運算)   2017-09-17 19:19:00
光michael對於alphago雪崩的言論我覺得基本唬爛光M對於AG不下雪崩的理由,我實在很難相信他有問過
作者: lwei781 (nap til morning?)   2017-09-17 19:29:00
不過Aja. 有說某些開局 Alpha 更不愛定型 會先動手
作者: staristic (ANSI lover)   2017-09-17 19:30:00
請問Heter大,Michael的言論有出處嗎?
作者: AirOctopus (AirOctopus)   2017-09-17 19:39:00
雪崩那是他自己推測的,有更新版是DeepMind跟他講的Michael又沒說雪崩一定怎樣,只是說他認為可能是怎樣
作者: HeterCompute (異質運算)   2017-09-17 19:42:00
我有點忘記是他在哪一集說過你說的這些,AO棋友還記得嗎?我想確認一下他用的字詞是什麼
作者: AirOctopus (AirOctopus)   2017-09-17 19:52:00
https://goo.gl/KubScR 大概8:30~10:00,講點三三那邊
作者: HeterCompute (異質運算)   2017-09-17 20:03:00
沒看到M有說他有問DM啊?只說DM短期大概不會放出data
作者: AirOctopus (AirOctopus)   2017-09-17 20:05:00
9:00他不是說:"I think they are saying AlphaGo isseveral versions ahead of Ke Jie version now"
作者: HeterCompute (異質運算)   2017-09-17 20:12:00
they是指deepmind嗎 之前也沒提到過啊@@
作者: AirOctopus (AirOctopus)   2017-09-17 20:16:00
之前沒說,但9:23 Chris說:"So the deepmind guyshave your contact information for when..."很明顯就是說deepmind不然會說誰
作者: HeterCompute (異質運算)   2017-09-17 20:29:00
就算退一萬步來說真的they是DM,但是他又加I think如果有確切聽到會這樣說嗎?
作者: AirOctopus (AirOctopus)   2017-09-17 21:10:00
可能跟某個員工聊天時聊到之類吧
作者: uyrmb47   2017-09-17 21:20:00
奇怪了 他無緣無故唬爛啥 是你才奇怪吧
作者: saladim (殺拉頂)   2017-09-17 22:16:00
很可惜不是把當時對戰的紀錄檔 像是思考過的變化圖之類的
作者: wadashi1 (阿拉丁)   2017-09-17 22:16:00
可是..不是柯潔下完之後,阿傑就放長假,然後就要調別的工
作者: wadashi1 (阿拉丁)   2017-09-17 22:17:00
作了. AlphaGo還可以更新好幾個版本,是怎麼回事啊?https://www.facebook.com/aja.huang Aja臉書,8/7上班
作者: kenwufederer (Nash)   2017-09-18 10:40:00
影片最大聲大概是樊落子的聲音吧不懂擺棋每一手都拍那麼大力做甚麼…然後變化圖手順一直錯,樊不能完全看完再擺嗎?雖然可能事先沒有棋譜,可是擺棋的過程與感覺一直反覆,比樊之前解說自戰還差…身為職業棋手,每手都大力拍棋跟手順一直反覆…實在無法認同…當然這只是我個人想法
作者: jaw13 (jaw)   2017-09-18 11:14:00
樊上次自戰就一直擺錯了 他說alphago不肩衝33後 害我對他講的東西都抱持懷疑
作者: oldTim (TIME WILL TELL)   2017-09-18 11:27:00
基本上在搜尋中間講的東西都是墊檔用,不用太認真
作者: kenwufederer (Nash)   2017-09-18 12:14:00
我覺得他直接給柯潔看,搞不好比較好講…雖然是當下另外的搜尋,但我覺得他們是在節目上樊是職業棋手吧?
作者: qqq1397 (渾汲噩營)   2017-09-18 16:49:00
墊檔講一些其他無妨,重點是該講的不講不該講的一直扯。一場集一直出包一直沒差,TMD1%沒差3%沒差8%也沒差的,沒差就直接講數字啊,講一堆無意義幹話誰跟你沒差!第二盤一直持平55才是沒差。
作者: wadashi1 (阿拉丁)   2017-09-18 18:11:00
大家都想吸收一些阿法老師的功力,但又怕被誤導..
作者: peterhuo (人生位階樂勝真爽)   2017-09-19 23:21:00
還在接近,事實就是一點也不接近

Links booklink

Contact Us: admin [ a t ] ucptt.com