作者:
Vonix (台灣大賭場歡迎您)
2016-03-14 13:19:53我嘗試用一句話來講ALphaGo的弱點
昨天AlphaGo第一次暴露出弱點,不知道是不是李世石有意為之?
李世石在左右方都避開了戰鬥,卻在大局不利時才在中央掀起戰鬥,
從盤後解析可以看出,白78神手挽回了局面,但若黑棋應對得宜,
局面其實還是細微;但卻造成電腦崩潰自爆。
從機器的角度來理解,中腹戰鬥比邊角更複雜難算,且昨天的例子有
可能形成大劫爭(但打下去黑棋整體也沒有不利),電腦在這種CASE
爆掉,不知道第五盤李世石會不會再度製造這種局面?
你說的沒錯 可是小李居然說弱點是阿發夠執黑有可能會爆之類的 這最好是有關係XD 他該不會故意不講出來弱點吧
他下完二十分鐘就記者會了,要這樣黑李九段太過了吧@@
從演算法角度來看...可能劫爭複雜度更高 他算不清楚勝率如果只是直接打劫可能勝率還算的清楚 但是是很多複雜變化中還有打劫的變化圖的話 可能他勝率就難以正確估算
http://www.thenewslens.com/post/297239/ 我沒有要黑小李 我只是想黑這篇報導而已XDD原PO你意思是官子中如果也有劫爭電腦也會算不清嗎?感覺也有可能耶 因為官子通常覺得電腦應該要很強...但如果也有劫爭說不定又要爆了
神手也不是說下就下得出來,小李78手可以發揮的形勢,至少在左方白塊被強壓黑造就明顯外勢時還看不出來,要說是刻意為之(蓄意造成78手的情形),小李除非有完成窮舉的實力(也就是圍棋上帝),否則根本不可能辦得到。
作者:
moonlind (又多了敷臉卡跟覓食卡了~)
2016-03-14 14:01:00今天的局面可能小李無心造成 但是如果有心引導 有機會因為一場打贏 其實大家也勾勒出AlphaGO的外型了就像古力快變成古力狗一樣 小李應該大多摸清了狗狗個性
有心引導是一回事,但AlphaGo也不是紙紮的,也要真的能次次應手都如李估計才行,這不窮舉達到圍棋上帝的境界根本不可能。古力昨天也不是次次猜次次中啊。更別說昨天AG大自爆時,並不是判定劫爭應手不利,而是錯
作者:
moonlind (又多了敷臉卡跟覓食卡了~)
2016-03-14 14:05:00目前可以利用的就 狗狗最愛避劫 愛及早定型 愛搶先手
再推,我現在對於AlphaGo缺點的看法就是Vonix派XD是不是可以說要製造這種局面,然後之後如果都做出很好的應對(像是白78,以及不犯錯)就有機會坐等自爆『製造局面讓電腦估錯,乘機爭取上風讓電腦自爆』之類?因為讓電腦算錯 及 讓電腦自爆 不必然等同
若是依這個邏輯,可能的勝點就只有「前盤保守避戰,還得在盤面製造己身大量弱棋區(昨天有三塊弱棋),然後在中腹
作者:
moonlind (又多了敷臉卡跟覓食卡了~)
2016-03-14 14:14:00耶~Nao大你說的不正是李世石拿手好戲嗎?XD
李世石的拿手好戲是當對手是人時才有辦法刻意經營的,現在的對手是「目前看來」不可能被對手刻意引導的AG耶對手是人時,有棋風、前中盤勢弱區(和邏輯上弱區)的限制,要利用對手的弱點、下棋的慣性去引導還比較容易,要刻意在AG面前造就那樣的局面,若真可以的話,前三盤就不會輸得這麼徹底。
作者:
Uizmp (黑袍法師)
2016-03-14 14:18:00也不一定, 前三盤還沒有測出AG在甚麼情況下有可能爆掉
作者:
moonlind (又多了敷臉卡跟覓食卡了~)
2016-03-14 14:21:00而且今天四盤下來慣性也大概確定了 甚至爆掉後 習慣一樣沒改 包括愛走掉先手 雖然會劫爭 但是先避再說 還有老是愛自損定型
所以我才說如果之後讓柯傑對戰阿發夠不公平 等於小李都幫他試出阿發夠的弱點了 然後給柯潔收成 若是弱點真的這
作者:
zeat (L.)
2016-03-14 14:27:00可是前三盤時的小李對alphago完全不了解,前三盤也算是繳了學費吧
樣 給柯潔來下或者小李自己重新下5盤我覺得都是5:0或4:1
作者:
zeat (L.)
2016-03-14 14:28:00之後柯潔面對的說不定是betago了XD
怕就是怕都有小李給了五局經驗了,柯潔還是被0:5完結若是如此,就代表阿發狗的bug只有在極端條件下才會被觸
作者:
wnglon (冷面笑匠)
2016-03-14 14:29:00先低調 明天很難說 第三盤的確有劫爭
發。(光是自我對戰3000萬局都沒發現有這bug,就夠離奇)
等等 你怎麼知道3000萬局沒有bug?難道開發者有時間一局
作者:
wnglon (冷面笑匠)
2016-03-14 14:30:00李的確只贏一盤 只是電腦爆掉的下法
作者:
wnglon (冷面笑匠)
2016-03-14 14:31:00連小學生都不如 這才是我失望的所在
類來刻意引出這種變化就不一樣了 畢竟中盤高空戰要出現
所以你覺得開發者有一局局看完?3000萬局?那我真的只能給
推NaoGaTsu,工程師可以寫出很多『壞棋偵測器』
,設計一台人工智慧下棋機,卻沒有任何驗證程式去確保演算法無誤?也太小看google的技術力了吧 = =
除非阿發夠爆掉都一定會爆到像昨天那種初學者程度 但如
我在想,AG自爆後一樣按MCTS運算接下來的勝率落點,但對
作者:
moonlind (又多了敷臉卡跟覓食卡了~)
2016-03-14 14:34:00如果有壞棋偵測器 那我裝在AlphaGO身上就好 今天也不會
對阿 如果今天真有這壞棋偵測器 為啥不用來過濾阿發夠下的棋?還是棋時開發者也對這壞棋偵測器沒有信心?
說白了就是你讓阿發狗跑3000萬個數據群集出來卻沒有任何工具可以分析大數據的正確性,這也太把以搜尋引擎起家的大數據公司「始祖」看太扁了。
作者:
Uizmp (黑袍法師)
2016-03-14 14:36:00AG的團隊中,不是只有aja比較懂圍棋嗎?人也沒有辦法每盤都看
言而總之,aja他們肯定有辦法找出誤區,否則阿發狗也不
就我看來它們頂多從3000萬局中取出些樣本出來 然後請樊
作者:
Uizmp (黑袍法師)
2016-03-14 14:37:00要用一些條件把這種所謂的bug濾出來, 或者叫AG回報
= = 有技術開發人工智慧的公司還得用人力驗證是哪招啦
作者:
moonlind (又多了敷臉卡跟覓食卡了~)
2016-03-14 14:37:00AlphaGO是用圖形偵測 怕是到87手才發現整個圖很糟糕
是啊,AG到87手才找出誤區,但為時已晚,沒屁用啊。
作者:
moonlind (又多了敷臉卡跟覓食卡了~)
2016-03-14 14:38:00AlphaGO的大局觀就是圖形偵測來的 但是也因此失誤
AG只是發現勝率驟降 勝率驟降一定是因為他自己突然下壞棋?所有勝率驟降都是有小學生棋步出現?
目前看來最有可能的,就是AG一到大劣勢區就運作失能了
AlphaGo可以說用圖形偵測嗎? 我理解那個只是類比@@
你問的問題只有等aja他們分析完資料才知道是不是了。因為我們目前知道AG發生勝率驟降的案例只有這一次。
你確定那3000萬局沒有?好 退一萬步說 就算它們真的有寫壞棋偵測器 而真的可以準確偵測壞棋 但是那3000萬局也是
作者:
moonlind (又多了敷臉卡跟覓食卡了~)
2016-03-14 14:41:00因為AlphaGO在爆掉之後 還去逃右邊死棋 想圍起來
阿發夠自己在下 目前看來他很可能就是自己迴避劫爭 等於
作者:
moonlind (又多了敷臉卡跟覓食卡了~)
2016-03-14 14:42:00所以我才懷疑 狗狗應該是用圖去感覺 造成大局觀
作者:
Uizmp (黑袍法師)
2016-03-14 14:43:00問題就在於今天這個種東西要怎麼回報, 回報後要怎麼修正
爭 並不是一定要下出劫爭 而是大型攻殺中有打劫的變化我個人對於這個bug要修正不怎麼樂觀 因為這不是告訴阿發
夠說你打劫的時候要多小心就好了 可能是要給他一個全新
輯出問題,阿發狗自己也無力修正啊。(例如是ValueNetwork給的權重錯誤或估算邏輯上編程錯誤)
作者:
moonlind (又多了敷臉卡跟覓食卡了~)
2016-03-14 14:44:00AlphaGO自我對奕 很多奇怪的bug反而會被隱藏起來
作者:
Uizmp (黑袍法師)
2016-03-14 14:44:00目前來看,AG是有辦法回報79手下錯,但是並沒有回報那些臭棋
所以嘛,就不是有沒有自我偵測誤區的功能的問題,而是阿
To moonlind & profyang,裝了也有不穩的風險,要測試的話,可以容許壞棋偵測器誤判,實戰不行。說不定測試時就都沒問題,所以就不裝啦。
作者:
moonlind (又多了敷臉卡跟覓食卡了~)
2016-03-14 14:45:00假設兩個笨蛋對奕 越對越聰明的可能性是?
也不是說一定想不出來新演算法 但肯定不是稍微修改一下
所以一開始的AG會變成只知道圍棋規則的30K棋士。
作者:
Uizmp (黑袍法師)
2016-03-14 14:46:00另外就是為什麼87步時就發現錯誤之後還可以下出97這種棋
對阿 總之也許你們說的對 有裝壞棋偵測器 但這偵測器準
作者:
moonlind (又多了敷臉卡跟覓食卡了~)
2016-03-14 14:48:00因為圖形類比吧 成就了阿法狗的大局觀 但是...
不準我就很質疑了而且就算準 阿發夠他自己的棋風也很可能導致他自己下時
作者:
moonlind (又多了敷臉卡跟覓食卡了~)
2016-03-14 14:49:00例如101手 可能有勝率 前提是李世石不鳥他 但人類怎可能不鳥他 人又不是笨蛋
另一個重點就是這個壞棋偵測棋到底要base on什麼原則去判定?人類對好壞棋的原則?可是我怎麼記得幾天前人類覺得的壞棋五路尖衝還被大大的稱讚?那壞棋偵測器應該要偵測出這種棋嗎?總之好壞棋的判定要化成程式碼我覺得很難 幾乎等於是寫出半個阿發夠了
profyang你說的有道理,確實可能知道有問題但是修不了只是我從資訊產業的觀點,覺得如果知道不會那麼早約戰..像101這種壞棋,我覺得寫個判定棋還是可以的不用很準,Aja或其他人可以從千萬盤抓出幾十盤來人工讀
而且棋時101要說是壞棋 是因為我們覺得他明明死了你還下但說實在的這部棋有損很多目嗎?就官子來看頂多5~6目之類真的筍比較多的我覺得反而是像93這種 外面還被94提掉 還有97也是 更損 但是這種要判定就不像101這麼好判定了何況以上這些"壞棋"如果今天剛好雙方正在打劫 那就叫做找劫材而未必是壞棋了 這時又開怎麼判斷 寫個打劫條件判斷式?可是有時候打劫也未必就一直在打 有時候打一打還會擺著 這時到底算不算"打劫中"?
為了打劫而下101不會對方剛提過劫才可能嗎? 我可能不懂不過確實同意是有不少難處我沒想清楚@@
一般找劫材確實要剛提過劫材可以 但是像剛才講的97這種正常之下非常損的棋 但是如果有要打很大的劫 有時可能會先來下97 這時不是單純的找劫材 而是製造劫材 因為97下了白棋如實戰正常的下了之後 會產生更大的劫材btw可是這場阿發夠確實在自己把打劫的變化削除了之後(91才跑去97製造劫材 所以97才是壞棋
作者:
wnglon (冷面笑匠)
2016-03-14 15:26:00有人說的很對 為何電腦會下101這種棋難道自我練習的三千盤從為出現過?我覺得ag劫爭的邏輯有問題而且電腦不會有情緒問題 是不可能下錯棋而自爆
作者:
tsai18 (......)
2016-03-14 15:33:00Alphago會不會面對業餘棋手更容易輸阿....
作者:
wnglon (冷面笑匠)
2016-03-14 15:35:00有人說ag有學習能力 很多盤面都下過了
作者:
Uizmp (黑袍法師)
2016-03-14 15:35:00不曉得以現在的AG,打劫甚至連環劫分支在評價系統中怎麼評估
作者:
wnglon (冷面笑匠)
2016-03-14 15:36:00但會犯這種錯誤頗無言 所以才推論ag無學習能力 而是用演算法走棋
作者:
Uizmp (黑袍法師)
2016-03-14 15:38:00看定義, 以自適應的方式調整演算法(落子法)叫不叫"學習"
作者:
birdy590 (Birdy)
2016-03-14 15:43:00有點想來整理一下 因為現在看來還是很多人沒搞懂
作者:
MicroB ( )
2016-03-14 15:44:00而且他的學習也不是看過就會 要數量夠大到影響勝率才會改
作者:
birdy590 (Birdy)
2016-03-14 15:46:00請先看一下 7779
看ELO就知道了,業餘來下就是被alphaGO穩穩勝
想太多...業餘棋手根本很難在阿發夠面前造成這種局面
我覺得大家想太多,只要盤面太小無爭勝之處就會亂下了下哪都會輸,所以要繳棋賭對方出錯,都應對都投子了只是前3盤領先落後不多才沒看到,我猜自我對亦時師的alphago尾巴就會這樣下
所以李九段前期避戰是為了製造這樣的局面嗎0.0?神78手 好像想了超過15分鐘的樣子??
profyang你有沒有什麼看法XD? 看了第五局白48開始,我開始覺得你終究是對的,Deepmind可能沒有測試得很徹底+ AlphaGo本身棋風可能找不出這類bug重新用科學家而不是棋迷的角度想,突然覺得更能理解XD現在覺得Deepmind團隊就只是真的想來切磋學習@@