[心得] AlphaGo常見問題總整理 Roger0123 PTT批踢踢實業坊

[心得] AlphaGo常見問題總整理

作者: Roger0123 (Roger) 2016-03-13 21:41:07

大家好，
我這幾天看了很多資料和文章，
整理了一些關於AlphaGo的常見問題和解答，
希望能減少大家對AlphaGo的誤解。
如果認為我寫的回答有錯，
或還有什麼值得編進去的問題，
都歡迎推文告知，
我會盡快修改。
全文連結：
http://roger0123.blogspot.tw/2016/03/alphago.html
全文：
AlphaGo是什麼？
AlphaGo是英國DeepMind公司開發的一套圍棋AI程式，也是目前（2016年3月）已公開的圍棋AI中最強的一個。
由於DeepMind公司已經被Google收購，所以AlphaGo也可以說是「Google的AlphaGo」。
在2015年10月，它以5:0擊敗了連續三年獲得「歐洲圍棋冠軍盃」冠軍的樊麾二段，在2016年1月公開了消息後，引起棋界及學界的注目。
在2016年3月9~15日，它與當時公認最強棋士之一的韓國棋士李世（或稱李世石）進行5局的「人機大戰」，目前進行到第4局，由AlphaGo以3:1領先。
AlphaGo的中文名稱是？
目前沒有官方譯名。
比較可能的翻譯大概是「阿爾法圍棋」，因為「Go」就是「圍棋」的英文，而這是從日文音譯到英文的。也有各種翻譯像是「阿法狗」、「阿爾法狗」、「阿發狗」。
AlphaGo跟其他的圍棋AI差在哪裡？
最大的差異在於AlphaGo使用了「類神經網路」這個技術，這讓AlphaGo擁有媲美職業棋士的「棋感」和「局勢判斷能力」，目前其他AI都沒有如此精確的估算能力。
（「棋感」可以解釋成「看盤面就能快速知道下哪些位置可能不錯」的能力）
AlphaGo是不是把大量的棋譜存起來，下棋時參考？
不是。
雖然AlphaGo在訓練過程中確實有看過大量棋譜，但這些棋譜只被用來調整AlphaGo的參數，沒有被存進去。可以這樣理解：AlphaGo不是死記棋譜，而是記住其中的應對原則。
棋譜中沒出現過的棋形，AlphaGo是不是就無法應對？
不是，但可能應對得比較差。
因為AlphaGo本來就不是死記棋譜，所以就算是跟棋譜不完全一樣的棋形，AlphaGo也能大略判斷出合適的應手。
而且AlphaGo（或任何圍棋AI都）具有「試下接下來的棋步並判斷局勢」的能力，所以就算AlphaGo沒辦法只憑過去的經驗找出適合的應手，也能即時計算之後的好幾步，看哪一手最有可能讓它獲得優勢。
不過如果棋形真的太特殊，導致AlphaGo漏算了某些不容易發現的棋步，就有可能會下得特別差。
為什麼AlphaGo這麼強？
我認為可以這樣想：AlphaGo擁有與職業棋士差不多的「棋感」和「局勢判斷能力」，又有人類所不及的「運算能力」可以計算接下來數十步的變化，所以能打敗人類職業棋士也是不意外的。
AlphaGo有沒有弱點？
一種說法是，如果能下出棋譜中極少出現的佈局、妙手，出乎AlphaGo的預測，AlphaGo就會很難應對。例如與李世石對弈的第四局中，在李世石下出第78手的妙手之後，AlphaGo之後的幾手就下得特別差，很可能就是這樣的情況。
這方面說法很多，建議直接看Google搜尋的結果吧！
＝＝關於AlphaGo與李世石的比賽＝＝
AlphaGo在賽前有沒有針對李世石做調整？
沒有。
在這段採訪（英文的）中DeepMind公司的CEO

作者: sadmonkey (下雨天) 2016-03-13 21:43:00

AlphaGO單機跟分散式相關的訊息

作者: pikachu2421 (皮卡＠めぐ民) 2016-03-13 21:43:00

推整理

作者: IcecreamHsu (冰淇淋) 2016-03-13 21:45:00

整理得不錯

作者: bxxl (bool) 2016-03-13 21:45:00

小修正一下,樊麾第五盤就已經有打劫了這個樊麾自己有說,網路上棋譜也可以看到

作者: andylin8707 (新垣是我的) 2016-03-13 21:46:00

推

作者: scju (QQ) 2016-03-13 21:47:00

「由AlphaGo以3:1領先」→這樣講不能說錯，但更好的講法是lphaGo已經確定在五戰三勝的系列賽贏了，接下來只是看李世石最後是拿下一局或二局。

作者: oklaohya 2016-03-13 21:48:00

推整理

作者: profyang (prof) 2016-03-13 21:51:00

不是不能打劫是不擅長打劫說真的怎麼可能不能打劫 Zen之流的都會打劫了只是擅不擅長而已

作者: Marino (馬利諾) 2016-03-13 21:53:00

固狗阿法狗超順的

作者: Dialysis (　　　　　　　　　　　) 2016-03-13 21:54:00

有辦法從程式的觀點來解釋「不善長打劫」的現象嗎?

作者: wukevinboy (wukevinboy) 2016-03-13 21:55:00

優文

作者: EasternAsh (砲灰) 2016-03-13 21:56:00

應該是說電腦判斷打結的勝率還有複雜度高盡量避免電腦沒有擅長的概念他就是照數據模式走而已

作者: profyang (prof) 2016-03-13 21:57:00

就是打劫變化太複雜會扯太遠讓他看不清楚勝率當然阿法狗相對之前的Zen的打劫能力一定也比較強但是應該比職業頂級高手弱

作者: EasternAsh (砲灰) 2016-03-13 21:59:00

勝利最大化是對的如果是贏子最大化會變成招招險棋會變成棋靈王有一集新人賽左為和塔使名人那樣

作者: Uizmp (黑袍法師) 2016-03-13 22:00:00

也有可能是現階段AG歸納出來的結論就是避劫,因為勝率會降低

作者: H45 (!H45) 2016-03-13 22:00:00

第四盤局後問答中有提到AlphaGo賽前訓練的棋譜是業餘高段棋手

作者: EasternAsh (砲灰) 2016-03-13 22:01:00

電腦不太可能像人類這麼彈性去判斷何時該執著冒風險

作者: H45 (!H45) 2016-03-13 22:01:00

跟類神經網路自己跟自己左右互博的棋譜，所以沒有針對李世石問答中也提到AlphaGo在五局中都是使用同一個版本的AlphaGo

作者: bye2007 ( ) 2016-03-13 22:05:00

大推整理

作者: profyang (prof) 2016-03-13 22:07:00

打劫怎麼勝率會降低?那職業棋手都白癡沒事找劫打?

作者: Uizmp (黑袍法師) 2016-03-13 22:16:00

我是說AG的理解(推測), 不是人類的

作者: EasternAsh (砲灰) 2016-03-13 22:16:00

我是覺得他們可以設定電腦遇到危機後運算開深一點

作者: EasternAsh (砲灰) 2016-03-13 22:17:00

險棋模式關鍵時刻允許更花時間去深層大範圍的計算

作者: Uizmp (黑袍法師) 2016-03-13 22:18:00

看直播的評論都說, AG這幾盤棋盤中有要複雜度減低的傾向

作者: EasternAsh (砲灰) 2016-03-13 22:18:00

他們以後要讓電腦自主學習我建議把棋譜時間也算進去

作者: indium111 (#ttyhg) 2016-03-13 23:07:00

大推，很多不瞭解AG的總是有些奇怪的問題

作者: bbbtri (cycling) 2016-03-13 23:15:00

我想問幾個問題第一是背定石和開局佈局算不算背譜？SL network難道只能算是過一下、無涉及「背」的習得人類棋步？你是把「學習」重新定義了嗎？另外 , 「獲勝機率最大化」不該對應「獲勝目數最大化」.......因為後者不會是個好參數可能會導致AlphaGo沒有棄子的誘敵戰術Demis在記者會上回答的有可能並不精確個人覺得

作者: tobygameac (toby) 2016-03-14 00:20:00

https://www.youtube.com/watch?v=yCALyQRN3hw&t=6h9m這邊有回答到沒針對的部分

作者: automaton 2016-03-14 01:50:00

超清楚

作者: darkseer 2016-03-14 06:30:00

推。關於AlphaGo對李世石可能調整，要不要補官方回應XD?

作者: bbbtri (cycling) 2016-03-14 11:27:00

請問"根據NN算出落點"是在對戰中進行的嗎？

作者: darkseer 2016-03-14 11:33:00

To 樓上: 是啊，SL policy, RL value, rollout都是唄

作者: bbbtri (cycling) 2016-03-14 13:11:00

我覺得你在唬弄啊要value 憑空要怎麼value? 又不是鄉民把棋譜數據化再根據這個數據做分析作出判斷的標準然後就可以公開說AG完全都不用靠棋譜的喔~~ 哈這種說話技巧也太厲害沒人覺得AG可以在比賽中找到一盤剛好跟正在進行的一樣情況的棋局然後照著下但它要靠數據做分析而數據對電腦來說就是棋譜好嗎！照你的話，你覺得AG把棋譜「用來train neural network，train完就把棋譜扔了」，就可以假裝根本沒有一個放棋譜的資料庫存在？那它一開始是從哪裡拿棋譜出來train呢？你的自由心證裡嗎？我都說沒人以為它是拿棋譜出來照著下了，你還硬要再扯到棋譜的定義.....真是無言。就跟你說的更清楚一點，DeepMind的老闆在第四局後的記者會講的很輕巧，說AlphaGo「只用過網路上業餘棋手的對局」，這話大有疑問，他們的演算法真就那麼厲害？！而你在這裡還幫他再補一句其實連棋譜的資料庫都沒有....甚至扯到維基百科 lol

作者: Severus (小黃) 2016-03-14 15:26:00

alphago最近是封閉版本，不會進化。

作者: darkseer 2016-03-14 16:14:00

bbbtri你真的誤解了，真要說..他們的演算法就是那麼厲害人記得棋譜，下棋時舉一反三下棋我們可能會稱為背如果打完譜忘了，但是從中學到的經驗觀念加以使用則不是演算法不能簡單擬人化，但是真要擬人化就是像後者...對了，跟李九段對弈的有1920 CPU+280 GPU，來源維基百科

作者: bbbtri (cycling) 2016-03-14 16:59:00

你以為利用機率來下棋就不涉及"背"嗎？取80%的著手來下或是取20%的著手來下難道都不算"真接應用"?"直接應用"

繼續閱讀

Re: [心得] Alphago的弱點turing [討論] 神之一手存不存在?lolylolyosu Re: [討論] 李世石對 AlphaGo 第四局 78 手解說(找到bug)wnglon [討論] 李世石 VS AlphaGo 第四局看法wukevinboy [新聞] 柯潔：李證電腦不完美盼約戰不怕對手進步zkow [討論] 大家第五盤還是比較看好Alphago嗎？zkow [討論] 李世石對 AlphaGo 第四局 78 手解說willrise Fw: [新聞] 李世石:找到Alphago的弱點了cscscscs22 [討論] Alphago的弱點在於調配時間嗎？wxes [新聞] 她是道地台灣女孩去了日本卻稱霸全國zkow