[建議] 各AI分析、AlphaGo是300年後的人類

作者: AirOctopus (AirOctopus)   2017-01-03 11:33:36
我要用我的理解來分析AlphaGo強度,主要借助工具是Elo,先看張圖:
http://i.imgur.com/ylQTErVl.jpg
AlphaGo V13是3000分、V18是4500分,也就是每代會多300分。
(根據查到的Elo公式,「勝率= 1/(1+10^m) * 100%」,其中「m= 兩選手Elo差/400」,
所以差100勝率為64%、差200為76%、差300為85%,跟AlphaGo每代間80~90%勝率吻合。)
各個AI強度分析:
人類最高等級大概3600,也就是AlphaGo V15,不過AlphaGo自戰導致Elo通貨膨脹,
因此V15大概略弱於人類頂尖,斷定人類頂尖介於V15~V16之間。
而DeepZenGo跟趙治勳比賽版是3000,對網路9D以上勝率超過90%、贏過幾位前段棋手,
也就是V13快棋已有機會勝過前段棋手,如果V13快棋有機會勝過前段棋手,
那V14大概快棋等於、甚至略勝前段棋手。
而絕藝的升級版刑天,快棋對決前段棋手快90%勝率,所以估計實力比V14強、比V15弱,
Elo 3400左右。雖然網路快棋對柯潔 5:2 領先,但正式賽對柯潔大概勝率只有24%,
也就是七番棋會2:5或1:6落敗(不過至少能贏柯潔一盤了)。
至於GodMoves或Master,由於沒輸過所以無法估計,不過要做到目前的超強41連勝,
以 AlphaGo V15 3600分的人類頂尖實力,加上快棋優勢即可輕鬆做到。
有人懷疑GodMoves或Master是AlphaGo,我認為很有可能,因為韓國網友都沒消息,
如果真的是韓國AI,韓國那邊應該多少會有風聲,至少謠傳比如誰做的之類。
(當然可能是因為沒人看得懂韓文,所以才沒人知道韓國當地的傳言。)
外加柯潔對AlPhaGo以幾成定局,從2016的直播來看,中國棋手會強烈要求先下測試棋,
因此不排除Aja或樊麾會讓Master先上線,所以我大膽推定Master就是AlphaGo!
至於到底是AlphaGo哪個版本,我認為應是V18或V19,(柯潔說最新是V25版),
因為沒道理放個比V18更低的版本,而且從DeepMind不斷保密AlphaGo實力、
覺得會讓大家嚇一跳來看,http://i.imgur.com/QLWVmNC.png,
也沒道理放一個太新的版本(從0直接變100才有趣,先放個50的就破梗了。)
所以我大膽推定就是V18,Master = GodMoves = V18!
(不過是V19或V20的可能性也不低,畢竟現在已經有V25了。)
心得:
V18 4500分已經人類無法企及,快棋在人類看來可能更跟神仙一樣,根據上面分析,
可能快棋V16就已經跟神仙一樣,人類早已無法區別實力。
整體人類每年Elo大概多個8~9,AlphaGo現在每個月升一代、Elo+300,
成長速度是人類的400倍。現在的V25 AlphaGo預估6600分,比頂尖人類多了3000分,
相當對柯潔勝率高達99.9999968377%,也就是如果辦個「一億番棋」,柯潔可以贏3盤...
AlphaGo V25,相當於333年後的未來人回來下棋,333年前大概是1680年,
相當本因坊秀策出生前150年、大清國棋聖范西屏出生前20年,如果柯潔穿梭回去那時候,
棋弈水準大概就是現在的AlphaGo。
作者: oldTim (TIME WILL TELL)   2017-01-03 11:39:00
人類棋手若能和數學家合作,開發新的理論,還是有機會贏此理論只要是解析解,就可擊敗近似解且人腦可以掌控
作者: zkow (逍遙山水憶秋年)   2017-01-03 11:56:00
人類還是能大躍進的
作者: paulli (paulli)   2017-01-03 12:11:00
請問您的文章能借轉yigo嗎? 謝謝!
作者: AirOctopus (AirOctopus)   2017-01-03 12:15:00
OK!
作者: ggoutoutder (女朋友的左手)   2017-01-03 12:25:00
數學家XDD
作者: aaaba (小強)   2017-01-03 12:30:00
哈哈哈哈,np-hard問題的解析解
作者: hipocritos (兔尾)   2017-01-03 12:39:00
解析解...噗噗
作者: semihumanity (沙漠之狐)   2017-01-03 12:49:00
滿有趣的!
作者: aegis43210 (宇宙)   2017-01-03 13:00:00
看有沒有棋手要學李世石第四盤的下法和master下
作者: oldTim (TIME WILL TELL)   2017-01-03 13:23:00
誤用解析解是我的錯,小弟的意思是藉由跨界合作讓圍棋理論能更加接近公理化的數學一樣清晰,比如手割理論目前還存在很多模糊不清之處,也是人未來進步的機會
作者: paulli (paulli)   2017-01-03 13:34:00
謝謝,轉文位置 https://goo.gl/e6Gbiy
作者: liaon98 (liaon98)   2017-01-03 17:09:00
成長應該會是呈J曲線 到後面應該就不會這樣一千一千的加了 反正只要強一些就能贏了
作者: ddavid (謊言接線生)   2017-01-03 18:09:00
ELO算法不會讓分數無限線性成長基本上一個超強者把別人都殺爆會導致別人的ELO都不斷下降,因而他贏別人取得的分數會越來越低
作者: AirOctopus (AirOctopus)   2017-01-03 18:17:00
但輸給elo高很多的也不太會降,主要是elo差不多的人碰到較會有變化,AlphaGo新版可以利用電舊版狂升Elo如果能把舊版殺到剩20%勝率,elo基本上就比舊版高很多所以有更高的elo後,更新版再把原新版殺爆,又可狂升elo大概是輸強很多的沒事、贏弱很多的也沒事、贏高很多得升很多、輸弱很都得掉很多。所以我好像搞錯了,是算碰到差很多的人比較有變化(?)
作者: ddavid (謊言接線生)   2017-01-03 19:33:00
沒錯,新版一開始初始積分殺舊版高分會生很快,但是舊版就會跌很快,兩邊往中間靠攏後勢頭就會趨緩,不會因此新版就會相對舊版分數線性漲上去。所謂的暴升只有一開頭。
作者: AirOctopus (AirOctopus)   2017-01-03 19:43:00
但舊版elo就在那裡,新版確定elo後大概就多個300,再新版又可以靠原新版多個300,基本上就無限上升啦每代相對勝率80%就不斷無限上升啦
作者: ddavid (謊言接線生)   2017-01-03 20:00:00
新版一定會比舊版多加300的依據是什麼,這可不是例證法能證的東西XD每一版本之間的勝率就不一定相同了,而且目前你看到的ELO值都是宣稱出來的,並沒有丟到包括人類棋手的這個池裡面實際跑過,光是公開比賽過的那個版本之ELO值就已經不夠可信了,我認為要拿這個宣稱的ELO值來說後面的故事還太早
作者: AirOctopus (AirOctopus)   2017-01-03 20:04:00
deepmind說大概80~90%勝率就算一個新版本啊
作者: ddavid (謊言接線生)   2017-01-03 20:08:00
喔好,我知道你在說什麼了XD
作者: AirOctopus (AirOctopus)   2017-01-03 20:08:00
我不確定實際分數怎麼算,如果差300=85%勝率的話,差
作者: aaaba (小強)   2017-01-03 20:09:00
這篇本來就趣味導向,幹嘛看那麼仔細,那我來問一句,300年後有人類嗎?
作者: AirOctopus (AirOctopus)   2017-01-03 20:09:00
個300應該是正常
作者: ddavid (謊言接線生)   2017-01-03 20:10:00
不過ELO本身就不是一個用在單挑勝率評比的的東西,AlphaGo版本之間的高勝率差有可能是改善了前一版的某致命缺點(即便那個致命缺點也許人類也引發不了)
作者: AirOctopus (AirOctopus)   2017-01-03 20:11:00
我的確對elo不算很了解,我只是用查到的公式去算的
作者: ddavid (謊言接線生)   2017-01-03 20:13:00
也許真正的整體實力不見得是這樣飆升的,等待實戰吧趣味導向的文章就不能被仔細看是在侮辱寫文章的人嗎?XD
作者: AirOctopus (AirOctopus)   2017-01-03 20:13:00
可能會算出完全錯的東西也不一定XD
作者: liaon98 (liaon98)   2017-01-03 20:13:00
贏的人elo會上升 輸的會下降 A大你這樣講等於是把輸的AI的elo訂死 這樣才能讓贏的AI的elo無限上升
作者: ddavid (謊言接線生)   2017-01-03 20:15:00
不,就單挑重複一直下的情況下他說的其實沒錯同樣兩人重複下無限盤,如果勝率很固定,分數差會收斂在他說的範圍附近這樣
作者: aaaba (小強)   2017-01-03 20:20:00
為了不侮辱人,我也來仔細看,把一隻AI 放到elo評比,分數絕對高不起來,要放超多AI,才能把地基夯實,墊高最強的那隻AI的elo,屆時需要的AI的數量可能比人還多
作者: ddavid (謊言接線生)   2017-01-03 20:29:00
其實主要原因也就是對局數不夠,就算理論上的ELO可以那麼高,但實戰沒那麼多場次就堆不到那個地步XD所以你說加AI數量也是沒錯,其實就是增加總對局數量
作者: tume7 (無敵七)   2017-01-03 21:11:00
說不定是單機版阿老師…
作者: s4340392 (yo)   2017-01-03 22:25:00

Links booklink

Contact Us: admin [ a t ] ucptt.com