Re: [心得] 電腦圍棋的小常識

作者: cabon (低語森林悄悄寧靜)   2016-02-01 17:43:28
推 staristic: 我猜應該秒殺,這些名局應該是第一批餵AI的食物 02/01 11:57
→ staristic: 就算不是第一批,應該也是餵過。如果答不出來…… 02/01 11:57
很難阿
之前做題目都會遇到
題目太大電腦跑不動的狀況
就算是付費的熊貓老師也一樣 哈哈
推 kafai: 餵過跟TRAIN起來是兩回事,偶發的鬼手可能當NOISE進不去 02/01 13:07
推 coldmilk: 我不行啦,身體太多毛病,已經不寫圍棋程式了。還有Cold 02/01 13:16
→ coldmilk: milk根本比不上Zen,倒是交大吳毅成老師的團隊開發的CGI 02/01 13:16
→ coldmilk: 最近棋力突飛猛進,我看很有可能已經有KGS 6D水準了 02/01 13:16
喔喔
這訊息就沒跟上 那這次如果有去溫哥華的話
再來學學
推 aaaba: 這個問題太有趣了。因為機器學習講究的是學到普遍性的原則 02/01 13:19
→ aaaba: ,而非記憶各種特殊解,所以這個問題就得看這些鬼手發生當 02/01 13:19
→ aaaba: 時的盤面會不會透過類神經網路映射到一個容易發現鬼手的特 02/01 13:19
→ aaaba: 殊空間(而不是人類直觀看到的361維空間)。如果可以,表示Al 02/01 13:19
→ aaaba: phaGo的普遍性原則萃取得非常之好,很神。 02/01 13:19
→ nanlong: 有時鬼手妙手是因非理性或失衡造成某種局面而爆發出來的. 02/01 14:02
→ nanlong: 人比較會這樣..電腦很理性我就不知會不會這樣會爆。 02/01 14:03
→ nanlong: 有時雙方無錯著還挺無聊的-看起伏落差大的對局有趣點。 02/01 14:05
我以為圍棋的美麗就是這些層出不窮的鬼手跟妙手阿
這不也是實力展現的一部分
另外藤澤跟加藤的對局
如果那一手是唯一解 那理論上電腦就該跑得出來這位置
這也是個很好的測試阿
http://imgur.com/FljPwS6
不然遇到這個狀態下的李世石要贏還真是很辛苦....
白68右下角托 大部分的人跟電腦應該都會覺得這只能跟著應...
手拔中央尖一個實在太強
作者: ztdxqa (ztdxqa)   2016-02-04 12:22:00
Deep Learning 不可能學到鬼手 鬼手只能靠硬爆 也就是暴力窮舉破解法 等電腦速度能算到五十步以後鬼手就會出來了現在AlphaGo的演算法就是跟人一樣是靠學習的 不要把它想的那麼厲害 還有我不太懂什麼叫做唯一解@@ 下圍棋還有唯一解的話除了局部攻殺 我不覺得有人可以證出來我覺得現階段AlphaGo不可能靠佈局贏人類 只能靠人類的失誤但人是很容易算不清打勺的有一點我是覺得值得討論 當AI贏了人類後 圍棋的普及是會進步還是退步呢?我自己感覺是會退步 因為他的魅力對沒有接觸過圍棋的人來講是減少很多的 不知道國際象棋在1997年以後普及的程度有提高嗎?還是越來越少人下了?
作者: aaaba (小強)   2016-02-04 12:43:00
“不可能找出鬼手”,是一句不能證明的論述。人感知的鬼手隱蔽程度高段與低段就有所不同,何況是不同參數學出的各種cnn如果如果某些鬼手在AlphaGo認為下一手可能位置的機率值的前二十名,算是學到了嗎?
作者: ztdxqa (ztdxqa)   2016-02-04 13:03:00
如果機率是前20 然後最後應法都正確的話 就算找出鬼手沒錯
作者: ddavid (謊言接線生)   2016-02-04 21:32:00
就這些完全資訊公開的棋類遊戲來說,最佳解都是被證明存在的啊,當然最佳解可能不是唯一的至於鬼手只能靠暴力法找這個論述你講得有點果斷,我不同意
作者: ztdxqa (ztdxqa)   2016-02-05 06:00:00
我說的鬼手只能靠暴力解是以目前的演算法作為基礎的以目前發展的演算法 鬼手要出來的話必須靠暴力搜索來"找到" (並不是學到) 當然科技進步那麼快 說不定兩年後新的演算法發表出來也是有可能的我是覺得以目前這個演算法就有機會打敗人類頂尖了 Google並沒有想要把圍棋AI變成神 等到目前這個AI的棋力比頂尖棋手強一子後這個象徵性的研究項目大概也會結束 接下來會研究的可能就只剩對圍棋有興趣的 要組織二三十人有AI知識的研究者是不太可能的
作者: aaaba (小強)   2016-02-05 07:46:00
我認為人和機器行棋中目的都是在於“有效率的搜尋到較佳的一手棋”。至於你所謂“學到”和“找到”到底區隔在哪?我不是把AI當神,而是認為不必把人的“學習”當成神聖的詞彙,套在機器上面好像就有種抗拒感。
作者: ztdxqa (ztdxqa)   2016-02-05 10:19:00
我非常同意你所說的"有效率搜索到最佳的一手棋"因為這以目前的狀況下(例如機器資源配置 秒數設定) 所能得到的最佳手鬼手有點像是唯一一手 神之一手這樣 想要強調的是AI沒有那麼強 不要把那麼神聖的任務放在他身上AI沒辦法達到唯一的一手是很正常的 也不要因為這樣就覺得人類最終還是比較有創造性啊什麼的 然後去排斥AI最近看到有些論壇把AI神格化或是妖魔化感覺都不太恰當噢 我對把學習這個詞套在機器上一點也沒有抗拒感我把學到跟找到兩個詞做一下區別只是區別用在AlphaGo的演算法上面 以Deep Learning找到鬼手是不可能的 但如果用傳統硬爆搜索的方法就有可能 但因為硬體運算速度限制所以目前很難實現職業棋手所謂的鬼手吧好像越講越不清楚 學到=機器學習統計得出 找到=用傳統搜索
作者: ddavid (謊言接線生)   2016-02-06 04:24:00
@ztdxqa 我只覺得你把AI(或說學習)的範圍過度狹義化了。然後再說一次,你認為學不到鬼手,這個結論太果斷了。先不提我前面有提過確實有研究就是針對找出稀少有意義的Pattern(雖然目前應該是並沒有圍棋的AI在使用,這比較常見於Frequent Pattern一系)我只要把學習的條件改為「越稀少但是有贏過」的下法,就能學到一大堆鬼手了。雖然相對地也會學到一大堆垃圾下法,導致這個AI整體來說可能很爛,但我要表明的是「現在的學習方法一定學不到鬼手」這個結論是不正確的而當中如果有針對性的設計,因為它可以用帶有亂數的自我對局進一步學習,學出鬼手並非徹底不可能的事,只是我強調「這是需要一些額外特別設計來支援」,它必須撥出一個比例的運算資源來處理稀少著手。然後「AI沒辦法達到唯一的一手是很正常的」這句話也很詭異就是了,因為就現在而言AI算不清的公開資訊棋類,人類也都算不清XD但很多人類也算得清的棋類,AI一樣都能學到唯一必勝的下法
作者: ztdxqa (ztdxqa)   2016-02-06 14:21:00
恕我見識淺薄 我確實沒聽過 frequent pattern這類型的演算法(跟naive bayse類似?)所以也不清楚發展到哪裡 如果他能用在圍棋AI上且能確實學到鬼手會是很大的突破 那這可能會是繼Deep Learaning RL又一大進步吧不過以目前 我所知道已發表的演算法(蒙地卡羅搜索CNN RL)我實在看不出要怎麼學到職業棋士所認為的鬼手 大頭鬼這種常用的當然是學得出來處理稀少數據確實是學界一直在努力奮鬥的目標 但目前似乎沒有一個很有效且通用的法(就我所知) 找到鬼手這種機率很小 可能一百場職業棋譜也找不出一手的數據量 我覺得很不太容易辦得到 尤其是以機器學習這種方法來實現至於你說人類算得清機器也算得清唯一必勝的下法 我覺得他用的算法一定是brute force 圍棋跟棋類相比 就是以目前的圍棋跟其他棋類相比 就是以目前的硬體效能 還不能用暴力法不能說國際象棋可以找出唯一解 圍棋就可以 又如果人類都算不清 你又如何評斷電腦算得清呢?(暴力解法除外) 所以我認為這是假議題.電腦贏人類 應該是不需要鬼手就可以贏了(最多三年吧@@)
作者: aaaba (小強)   2016-02-06 15:52:00
你的brute force到底是多brute?難道涉及到樹的搜尋都被你歸類為brute force?那人找出鬼手時如果用上一手手排除的尋找,也要被你認為是brute force?好吧!那你對了,deep learning 的確不是用來取代搜尋而是輔助搜尋,不用樹的搜尋而解類似賽局概念的問題我還沒想過有這種可能性,無論是人或機器。
作者: ddavid (謊言接線生)   2016-02-07 00:25:00
你說的學不到鬼手其實是建立在一個前提上,就是不能為了學鬼手而多學垃圾手拖累棋力。這叫是不為也,非不能也。然後我還是要說你沒有搞清楚你講出「AI沒辦法達到唯一的一手是很正常的」這句話到底有多不嚴謹XD我並沒有否定「現在的AI,很難在圍棋上得到絕對最佳解」,當人類跟AI都算不清時,你講那句話根本沒有論證任何高下的效果,特別是你句子還沒有指定圍棋XD然後鬼手也跟最佳著手一點關係也沒有,反而跟人類的思考比較有關,鬼手並不一定要是最佳著手,只要對人類來說是出乎意料,導致後續取得利益就可稱之,而要學到這種著手只要調整評估方式就有機會將之納入,只不過會同時也學到很多垃圾手而已,並非學不到。鬼手被算清後,它就可能會變成標準的妙著或其實是應對得當就沒那麼好的下法,而相對於人類使用大量研究來證實這些東西,AI也可以利用大量帶隨機性的模擬對局來進行「研究」,這其中唯一的問題就在於鬼手的稀少有可能導致AI一開始就沒有打算把它列入需要花運算資源去驗證的範圍內。因此,只要這邊做些設計,讓鬼手有可能進入被模擬對局驗證的範圍即可。當然如上面一直強調的,危險性就在可能讓很多垃圾下法也進去搶奪運算資源,甚至劣幣驅逐良幣,這跟灌進大量低棋棋譜結果越學越差是某程度上相似的狀況。賽局理論的話,事實上解賽局理論更需要窮舉,因為需要得到完整的pay-off table......XD而且事實上賽局理論的分析在某些情況還是會使用樹狀展開處理的,不管用樹狀或矩陣式,目標都是窮舉所有選擇對雙方的價值

Links booklink

Contact Us: admin [ a t ] ucptt.com