※ 引述《a127 (毛蘿蔔)》之銘言:
: ※ 引述《Emerson158 (紅豆 X 八嘎 X 烏魯賽)》之銘言:
: 個人只是看過一些簡報介紹,
: 但我覺得阿發狗的壓倒性實力應該沒那麼絕望才對。
: 以前西洋棋被電腦演算直接暴力破解,
: 原因在於合法步少,對手的下一手反制只有2X步可能,
: 圍棋的合法步多,前幾手對手的反制有200步以上的可能。
: 然後西洋棋的好步就是成功的殺死對手的棋子+國王,
: 圍棋的好步眾說紛紜,就連佈局來說不同的棋手就有各自不同的審美觀。
: 雖然人類已經神乎其技的知道自己的佈局在爭奪N個目的地,
: 但兩個不同的N相比起來,還是會很微妙的難以判斷哪方優劣。
: 所以圍棋比賽沒有足夠時間被暴力破解,
: 於是就變成阿發狗利用評價網路來建立圍棋的審美觀,
: 也就是把人類棋手應對的"好步"記起來,
: 利用這些好步跟有限的計算來擊倒對手。
: 原本我在想既然餵養阿發狗的食物來源也是人類創造的,
這段你搞錯了
餵人類棋譜長大的是舊版的阿發狗
也就是去年跟李世石下的那隻
去年那隻在李世石第78步下出神之一手後整個錯亂導致輸棋
可能也是因為李那步超越了去年狗狗建立的理論
今年這隻阿發狗是純粹藉由自我對局學習的
差別在於今年這隻會在前期中棋下一些違反常理
甚至被認為是臭棋的棋步
但事後發現這些棋步都是神之一手
所以才很多職業棋士說新版阿發狗顛覆了傳統圍棋理論
: 那麼阿發狗為什麼會這麼容易的擊敗世界頂尖的好手呢?
: 我在猜測其實職業棋手一場比賽其實"好步"的數量沒那麼多,
: 相較阿發狗則是利用他的評價網路希望他每一手都是好步(但可能也是部分而已)
: 會有這種猜測是這五十場勝利之中,其實有幾場是幾目的勝負,
: 而且都是在前中期阿發狗被評論大幅領先,在後面被人類追上。
: 我認為會有這種異常狀況出現,可能在於一部分的賽局都以投子結束,
: 等於在最後收官階段給阿發狗餵養的資料不夠多,
: 因此目前人類在後期的計算跟審美仍然略優於阿發狗的關係。
這點你判斷也是有問題
阿發狗中期贏很多 後期贏面變小的理由
主要是來自於他所設定的目標
對阿發狗來講 贏半目跟贏100目都是贏
所以我不需要贏很多 只要保持一定贏就可以了
所以狗狗在穩定領先時會變得保守的理由就在這邊
反觀人類在獲得優勢時 常常想要擴大優勢
但這個行為往往得不償失
這就是電腦最強的地方 電腦完全沒有情緒
他只往最高勝率的方向走 所以不容易犯錯
作者:
orze04 (orz)
2017-01-05 13:01:00AlphaGo在後期會把一些還有變化的地方早早結束掉
作者:
emptie ([ ])
2017-01-05 13:02:00這就是我們學棋跟阿發狗最大的不同……我們會關注贏多少 他只會管有沒有贏
作者:
orze04 (orz)
2017-01-05 13:03:00人會犯錯啊 又不可能像AI那麼精準計算
作者:
emptie ([ ])
2017-01-05 13:04:00也不能說人的下法不對 因為我們怕失誤 所以會希望能盡量多
作者:
orze04 (orz)
2017-01-05 13:04:00不能說錯的 人也很難完整複製AI那套下法
還有電腦的訓練量就算是最強的職業棋士都難望項背...職業棋士沒有辦法 24x7 都在下棋... |||
作者:
orze04 (orz)
2017-01-05 13:10:00AlphaGo能那樣下是因為它能發揮 人能不能發揮同樣效力?
AlphaGO 的著棋思路可能沒有辦法從內部結構去理解
人類跟ai在下圍棋的根本判斷方式有不同雖然結果都是為了最大勝率 但過程差很多
作者:
ADIE2 (ㄚ呆)
2017-01-05 13:16:00現在看起來李世石真的是神之一手 可能是阿發狗最後一敗
他前中期的下法.其實不是人類不懂..而是我們沒辦法判斷這麼宏觀這樣說好了.人類的觀點 都在局部.=而阿法狗下的 都是宏觀的勝利.其實人類也可以 只是...你無法像AI那樣.中收尾不出錯
"士傑讀了Alpha狗萬局練蠱棋局後 竟也成一代武林奇俠"這種套路感覺好像武俠小說wwww
其實看解說就能有這種感覺.有時候一個局部固定的定式解說就會說出這邊會怎樣下.但阿法狗就下一半 就不鳥了..跑出旁邊下.
作者:
zeyoshi (日陽旭)
2017-01-05 13:26:00我覺得電腦預測的能力比人類高很多 所以判斷是否需要收手或進攻的時間會變得相當準確
作者:
loadingN (sarsaparilla)
2017-01-05 13:27:00最大的優勢應該是不會有太大的失誤
只是因為ai的目標單純只放在贏而已ai在確定當前局面基本贏定後 就是不會再擴大優勢
作者:
seaEPC (沒看見,我沒看見 >_<)
2017-01-05 13:43:00目前這個發展階段能贏還是重點,不然AI目標要調整成盡可能贏越多目應該也不是問題,只是可能翻船機率稍大一點
作者:
jupto (op)
2017-01-05 13:49:00我覺得是因為AI預測能力高於人類 人類僅能不斷擴大優勢去確保自己的勝利機率 但AI可以不斷地消除自己輸棋的未來來確保自己的勝利 所以對於棋局的走向才會有所差異以程式的觀點人類的思考模式是loop AI是遞迴
作者:
jupto (op)
2017-01-05 13:54:00一個反著來 一個正面上 概念上有差啦
差別只是遞迴會呼叫自己不要亂套用專有名詞 那不是你想的那樣最好笑的應該是 以往圍棋大家都說人類有宏觀視野 戰略現在AI已經用實戰證明那些只不過是屁 人類應該謙虛點
作者:
zader (艦娘æ¦è—我è€å©†)
2017-01-05 14:01:00深層運算跟宏局觀真的是贏不過電腦
作者:
jupto (op)
2017-01-05 14:03:00事實上什麼宏觀視野 戰略人類自己都不瞭解那東西的本質結果使用模擬大腦運作方式AI就自己發展出來了
作者:
orze04 (orz)
2017-01-05 14:08:00遞迴可以用stack和loop做出來沒錯
區域不走完用機器的角度想可能是另一區的手價值更高吧即使當下這區放掉會損一些 也比不過另一區先下得的收穫
人可能都要下到顯而易見才能判斷價值高低 機器則看的早
如果可以看狗對狗的棋譜 感覺會很可怕一直維持在勝率50左右的宏局作戰 不知道長得怎樣
作者:
tsming (斷水流大師兄)
2017-01-05 14:46:00感覺該跪舔天網了XD
作者: grandzxcv (frogero) 2017-01-05 14:49:00
我看出人類對宇宙百害無一利,所以該毀滅人類
所以新版的有出PAPER了嗎? 我上次看的那篇有用到
作者:
opmina (夢遊吉他)
2017-01-05 14:50:00兩個ai的差異蠻有趣的
作者: lugiam (Anashisu) 2017-01-05 15:31:00
有那個版面對這個議題有深入討論嗎 想拜見一下
作者:
jupto (op)
2017-01-05 15:37:00看起來目前的狗狗沒有針對對手個體行為做預測與調整也就是不管給他誰當對手他的思考方式都一樣如果未來要出專門玩猜拳的狗狗 應該就會發展出個體行為分析與預測的狗狗了
換句話說,狗已經領悟圍棋本質,根本不在乎對手....好像更厲害...
作者:
jupto (op)
2017-01-05 15:46:00這要看人 有人覺得下棋重在兩個人之前的互相影響如何打亂對方的節奏 如何不被對方打亂節奏但是狗狗就只是在想怎麼放子可以贏
作者:
moonlind (又多了敷臉卡跟覓食卡了~)
2017-01-05 16:09:00究竟是從哪裡流出:這個AlphaGO是完全自我對弈出來的官方也只說新版 甚至沒講如何新版 怎麼腦補的?去年三月 AlphaGO就有過跳脫思維演出了 你也無法否定他在一年的時間內 透過自我對弈 又刪除了不少人類棋譜的可能性啊
那AlphaGO2只要跟AlphaGO1對弈練習...
作者:
zseineo (Zany)
2017-01-05 16:19:00從新版那個字眼聯想出來的,沒有正式說法
可是自我對弈的棋譜也是從上一版的AlphaGo來的吧?所以多少還是需要採用人類棋手的智慧?不太相信他們可以從全部隨機開始train出這版alphaGo..
作者:
orion (火星上的人類學家)
2017-01-05 16:26:00因為去年Google有說下一版的將會是自我對奕出來的版本所以才會這樣說吧人類的棋譜也是上千年棋局累積出來的可是電腦自己下,可能幾個月就能累積出人類上千年的量從而形成自己的棋譜
作者:
moonlind (又多了敷臉卡跟覓食卡了~)
2017-01-05 17:29:00但是圍棋wiki上寫的歷史 最早圍棋跟現在好像布一樣不知道現代圍棋 大概算是幾年的歷史
圍棋真的太奧妙,可惜相較之下西方不夠盛行,想看東西方各種天才的比拼
以後圍棋賽變成電腦拼電腦 人類會看熱鬧可是都看不懂XD
作者:
a127 (毛蘿蔔)
2017-01-05 18:59:00西洋棋被征服之後還是有職業棋賽阿