Re: [心得] 圍棋AI AlphaGo 之我見 mathbug PTT批踢踢實業坊

Re: [心得] 圍棋AI AlphaGo 之我見

作者: mathbug (天堂的定義) 2016-03-14 16:18:07

1. 據說 AlphaGo用到的Neuro Network深達13層
有任何穩定性的報告或是說明嗎？
2. 圍棋的勝敗至少包括兩種，一種是壓著打或是完勝，另一種是反敗為勝
AlphaGo的設計應該是循著第一條路線
問題是餵它的千萬盤訓練用人類棋譜卻包含非常多第二類棋譜
反敗為勝的棋譜應該非常多用的是勝負手(或是無理手)
不曉得這會不會是AlphaGo昨天崩潰的原因？
3. 以現在AG的能力，它應該可以先歸類/分群將之前訓練的棋譜分開
重新訓練時只採用第一種壓著打或是完勝的棋譜
也許就不會有無理手的出現了 (或數學上讓它的系統參數穩定)

作者: Uizmp (黑袍法師) 2016-03-14 16:19:00

AG設計團隊的理念應該是要盡量消除人類的影響因素 (?

作者: dan310546 (00) 2016-03-14 16:20:00

好像有可能

作者: indium111 (#ttyhg) 2016-03-14 16:21:00

所謂的13層應該是指AG的神經網路中的隱藏層有13層吧

作者: agreerga (鴨毛) 2016-03-14 16:22:00

2.3點不會有衝突嗎?

作者: birdy590 (Birdy) 2016-03-14 16:22:00

我覺得很多人都想太多了, AlphaGO 根本不是在下圍棋

作者: indium111 (#ttyhg) 2016-03-14 16:22:00

中間的參數設定沒看到有人介紹過(多數人應該也沒興趣)

作者: aegis43210 (宇宙) 2016-03-14 16:29:00

誰也不知道之後棋譜洗掉的alphaGO會變的如何？希望是成為以宇宙流為主的棋手，但人類就難以模仿

作者: bbbtri (cycling) 2016-03-14 16:41:00

如果演算法真的能創造出典範轉移難以模仿也可以喲~~期待今後AlphaGo發展出宇宙流的死活題給大家解

作者: Rinehot 2016-03-14 17:02:00

簡單來說昨天ag應該是沒有意識到出棋了才會下ㄧ堆損棋

作者: kafai (豬仔包 PigSonBow) 2016-03-14 17:58:00

3.的話誰來判斷呢？2.的話我覺得會有負面影響，但自我學習有機會把那些負面影響扳回來

作者: aaaba (小強) 2016-03-14 20:00:00

3的確是棘手的問題，大數據的labelling，可用value network試試

繼續閱讀

[新聞] 古力評柯潔是網紅柯潔慶祝李世石首勝喝醉zkow 從象棋觀點看AlphaGO為什麼會輸ctrl [新聞] Facebook工程師解疑：AlphaGo為什這厲害zkow Re: [轉錄] 「戰勝自己」對於AlphaGo而言不只是口號mgdesigner [棋訊] 今晚七點人機大戰3.4盤實況mariakoutei [影片] 人機大戰第四局，神之一手降臨f845652652 Re: [討論] 人機對戰的熱潮後，要如何推廣圍棋呢?kd1523 [閒聊] 中日韓的民間圍棋風氣盛行度liveforhappy [討論] 比賽可以看書,有助推廣圍棋吧?oooo [閒聊] "駭客棋手"? 會有這現象 ?nanlong