【安靜】圍棋AI給出的手段,難道就是正解嗎?
騰訊圍棋
作者:找藉口安靜點擊:2472023-04-03 13:25
圖片
原址:https://www.nihonkiin.or.jp/etc/go_weekly/tsururin083.html
原題:AIの手は正解なのか~大橋拓文七段と考えるAIとの付き合い方「つるりん式観る
碁のすすめ~こぼれ話」
摘自:日本棋院
作者:編輯K
翻譯和整理:找藉口安靜 這篇比較長就翻了
https://www.foxwq.com/Public/Uploads/image/20230403/t_16804987161.peg
這一次我們請了學術類鋼琴家,被譽為是太空人的大橋拓文七段。大橋拓文的鋼琴水平應
該是棋界第一人,對圍棋AI方面有著非常廣泛的知識,在經常下出一些AI手段的同時,還
研究AI是不是有極限,AI認為的最強手段是怎麼定義的,從科學和哲學領域對其進行研究
。
當今AI已經成為了觸手可及的工具,想到AI就想到能給我們準確的下法。將實力的基準提
升到了和AI的吻合度。但是AI真的是正確的嗎?難道提升和AI的吻合度才能是接近最好手
段的方式嗎?
在這個專欄中,我們直接把這些問題拋給大橋拓文,對AI的現狀進行探究。AI實力強勁,
並且能看到絕對的結論。而AI給我們顯示的手段,是不是我們想到的神之一手呢?我們借
此來瞭解一下深奧的AI世界的冰山一角。
——大橋拓文七段今天請多關照。
大橋拓文:請多關照。
——長話短說我們想針對AI進行採訪,AlphaGo出現至今已有7年多,AI現在已經成為了我
們觸手可及的東西。現在棋手們用AI進行研究已經是常態,在直播中用AI勝率值進行表示
,還用AI顯示出當前局面的推薦手段。拿自己來說,我在看棋的時候也會下意識地把AI給
出的手段當作是“正解”,實際上你覺得AI給出的手段就真的是“正解”嗎?
大橋拓文:這個確實很複雜,首先我們要對“正解”進行定義。多數情況下,下出比人類
更加精准,並且能贏棋的手段,我覺得比較接近于“正解”的。
——也就是說這不是“正解”,應該是屬於“最佳”。那你覺得AI給出的手段是“最佳”
手段嗎?
大橋拓文:我們先不談人類怎麼接受這些下法,首先AI是沒有“最佳”的概念的。在這種
情況下來評判“最佳”,是不是覺得是一件很困難的事情呢?比如說用最短的手數贏棋,
還是贏最多的目數,你覺得哪一個才是“最佳”呢?
——這麼說還挺有道理的,這兩個角度其實都可以認為是“最佳”。
大橋拓文:剛剛我也提到了AI沒有“最佳”的概念,但是AI在選擇每一手棋的之後,都有
著
“獲勝”的目標。然後如何設定“獲勝”的方式,就取決於各個AI的個性了。實際上這都
是由設計程序的人類設計而反映出的結果。
——這是什麼原因呢?
大橋拓文:比如說,AlphaGo把最終的目標定在“贏棋”,然後選擇避開高風險的手段,
選擇了贏半目的下法。所以就會選擇一些人類看上去可能會虧損的手段,但是AI依舊會選
擇安全的下法。後來就出現了從“以更大的目數獲勝”的AI。這就和“哥倫布的雞蛋”一
樣,因為追求更大的目數的AI比追求僅僅“贏”的AI更強大,但並不一定需要刻意去製作
一個追求更大目數的AI。總之相較於AlphaGo時代的AI,現在的AI越來越傾向于選擇高風
險高回報。
——棋風和人類一樣很有意思。
大橋拓文:進一步來說,現在還出現了在佈局階段,通過對手的手段來推測實力。一旦判
斷“棋力較低”之後AI就會選擇比較保守手段的AI。當然這也是因為當初程序是這麼設計
的,所以看上去才會那樣,實際上被下套的人就覺得自己就和漫畫《棋魂》中的棋會所的
那個大叔一樣,感覺任何下法都被他看透了。
——確實有這種感覺,就覺得AI是富有人格的。
大橋拓文:我也有這種感覺,但是後來冷靜地告訴自己,這些都是通過計算得到的結果(
笑)。
——我們換一個話題,有的棋手說:“因為AI自己手段的範圍變廣了”,也有說“自己的
手段變窄了”。而你又是怎麼感覺的呢?
大橋拓文:從長遠角度出發是變廣了,但是目前處在過渡期,確實有些人會覺得範圍變窄
了。
——這是什麼原因呢?
大橋拓文:AI會通過自我對局來提升自己的水平。比如我你和相同棋力、相同棋風的人一
直下幾千或者幾萬盤,你覺得會不會漲棋呢?
——難道不會變強嗎?
大橋拓文:你覺得你和棋風一樣的人一直下棋,實力會變強嗎?
——我明白了。確實如果和棋風相同的人一直對局,那只會反復下一樣的佈局。到後來只
擅長某一個佈局,但是其他手段的話可能並非如此了。
大橋拓文:就是這個道理。通過電腦進行自我對局,重複進行幾萬盤相同的事情。說實話
我們也不知道他是不是聰明(笑)。不過像AlphaGo Zero那樣開發這一類AI的話,讓電腦
自我進行自我對局的操作也非常重要。不過開發下圍棋很強的AI的話,現階段還是需要通
過人類的設置,才能擴大研究的範圍。這些其實從KataGo的官方網站就能有所瞭解。實際
上現在的圍棋AI的佈局套路也變得越來越多。
——我看AI經常點三三,這或許可能不是因為這是好棋才這麼下,而是因為這手棋經常出
現,所以AI也這麼下了。如果AI今後變得更強的話,今後的AI定式有可能會和現在完全不
一樣,佈局也有可能變得多樣化。
大橋拓文:就是這個道理,還有就是和現在相關的話題,那就是我想強調AI“不會像人類
一樣有認知,也不會有理解能力”。你應該還記得,AlphaGo剛出現的時候,很不擅長征
子和大頭鬼。
——是的,明明這麼強,竟然不認識征子。
大橋拓文:現在的AI通過人類的設置,把AI不擅長的棋型程序化了,所以現在他們也知道
什麼是征子了,有的人可能會覺得,這麼簡單的事情還需要通過設置來解決挺不可思議的
。為什麼會出現這種情況呢?那就是AI不知道征子,也不會理解什麼是征子。其實不僅是
征子,其實連兩眼做活,AI也都是一知半解的。
——詳細說說。
大橋拓文:人類會通過倫理來考慮手段,通過棋型來識別征子的棋型。這樣理所當然的事
情其實AI是做不到的。與其說做不到,AI在這方面的思維方式就不一樣。圍棋AI會把自己
摸索的範圍作為自己的世界,但是自己摸索不到的地方它們是不知道的。簡單來說的話,
比如說有一個手數很長的征子,人類的話只要知道征子的棋型,哪怕是100手的征子也是
可以下完並且吃掉的。但是AI就沒有“重複做這個動作”的想法,每一手棋都需要摸索,
所以在計算100手的征子時,他們計算到50手就有可能算不下去了。
前段時間出現了只要找到AI的弱點,人類就能戰勝圍棋AI的事情成為了話題。實際上AI連
死活的改變也沒有。為了讓AI產生錯覺,讓AI把自己的棋走成一個環,這樣的話AI就會覺
得即便只有一隻眼也能活棋。以前AI就有只要不會被拔起來的棋,AI就有可能將其認為是
活棋的錯覺。但是只要讓AI的棋圍成一圈,AI就完全被我們套路的事情。在這方面相較于
棋手,很多職業遊戲玩家比我們更厲害(笑)。並且人類只要有10級左右的棋力,就能輕
輕鬆松識破這個弱點。人類至少知道兩眼活棋或者雙活的概念,但是對AI來說,我覺得他
們對兩眼活棋的概念應該還是一知半解的。
——能輕輕鬆松戰勝頂尖棋手的圍棋AI,竟然沒有“認知”和“理解”的概念還是很意外
的。
大橋拓文:真的是這樣,問題是從AI獲得手段的人類,可能一直會覺得這是AI的認知或者
是理解。對AI來說,他們學習的世界可能會比人類做得更好,但是在他們沒有學習到的世
界,很多人類可以輕輕鬆松做到的事情,AI有時候可能就做不到。所以我們要理解AI的基
礎上,如何和AI共同相處才是非常重要的。
——不把AI一切當成絕對的結果是很重要的事情。最後還想問的一個問題是,我們今後如
何和AI共同相處下去呢?
大橋拓文:我們每天都和各種AI進行對局,現在圍棋AI的實力面對人類棋手是碾壓式的強
大。我的話至少要受讓30目才行。在撲朔迷離的局面下,AI的形勢判斷也很準確,包括需
要計算的中盤對攻,雖然在這種情況下可能比形勢判斷要稍微遜色一些,不過很多時候還
是比人類棋手要強。利用AI進行學習是非常有用的事情,還有可能會擴大圍棋的可能性。
不過很多時候覺得AI給出的手段很容易被認為是正解,其實很多手段有可能是錯誤的,即
便是正確的,我們可能也很難下出最好的下法。也就是說AI給出的手段對我們來說是不是
好棋,這是我們需要判斷也是需要我們好好學習的地方。
——現在的AI技術,在圍棋以外的領域正逐步開始變得實用化。這一次提到的和圍棋AI的
相處方式,今後在身邊可能會有更多的AI出現,在這種情況下我們該如何相處,這一次確
實是學到了很多東西。今天非常感謝接受採訪。
https://www.foxwq.com/news/listid/id/14188.html