「人機大戰2」未必選柯潔
北京新浪網 (2016-03-17 03:22)
原標題:「人機大戰2」未必選柯潔
昨日消息,谷歌人工智慧阿爾法圍棋(Alpha-Go)與韓國棋手李世石的人機世紀大戰
已落下帷幕,AlphaGo不但大勝李九段,還收穫了人類的世界排名,目前它排名世界第二
,僅次於中國棋手柯潔。雖然大家都認為未來的「人機大戰第二季」必然是電腦對陣柯潔
,但現實情況恐怕並非如此。
按照排名規則,因為在第四局中輸掉一場,Al-phaGo也有了正式的世界積分和排名。
在最新排名中,它以9勝1負的戰績,積3586分,排名世界第二,超越了韓國棋手朴永訓和
日本棋手井山裕太,僅次於中國棋手柯潔九段。在本次人機大戰期間,柯潔在各種場合主
動約戰,種種跡象似乎表明,世界老大和世界老二之間遲早會有一戰。
但阿爾法圍棋的創始人哈薩比斯表示「人機大戰2」還沒有提到議事日程,AlphaGo要
先返回英國,繼續提高棋藝,「我們認為阿爾法還有進步的空間。在此期間,將商討阿爾
法是否與人類進行更多的對局,幾個月後會公佈具體的安排」。此外,韓國棋院事務總長
表示:「正在推動再進行一次人類與機器的對決。如果舉行,有可能還是李世石(對戰電
腦),也有可能是其他棋手。韓國棋院正在與谷歌方面進行溝通。」值得玩味的是,在談
到此次人機大戰為何不選擇柯潔時,哈薩比斯認為,現在還不能確定柯潔何時成為傳奇般
的人物,將會繼續關注他的表現。華商報記者 趙蔚林
http://news.sina.com.tw/article/20160317/16430873.html
其實還蠻期待小李再戰Alphago一次的
但如果論新鮮度的話,還是戰其他的棋手比較好
原來是柯潔還不夠傳奇,所以沒有選他的關係
柯潔調整勝率表示應戰 人工智慧弱點論引爭議
人工智慧產業變局
此前,圍棋世界冠軍柯潔和中國象棋特級大師、北京隊主教練張強均向21世紀經濟報
導記者表示,軟體現已顛覆了棋類運動的部分理念和規律,終有一天人工智慧的棋藝會天
下無敵。
本報記者 陸宇 倪雨晴 北京、廣州報導
3月15日,人機大戰五盤結束,谷歌的AlphaGo以4:1戰勝李世石。至此,人工智慧已
在圍棋、國際象棋、中國象棋三項智力競技體育中,實現了對人類頂尖高手的全面勝利。
在戰勝李世石后,DEEPMIND研發工程師拉里亞·哈德塞爾開始把目光轉向柯潔,他在
社交軟體臉書上表示:「柯潔,準備好了嗎?」
而據21世紀經濟報導記者得悉,在看到臉書上的非正式挑戰後,柯潔的經紀人庄文回
應稱,還沒有接到谷歌方面的正式邀請。「如果接到邀請,柯潔將會欣然應戰,此前在解
說李世石棋局時,柯潔就多次表明了態度。」
此前,圍棋世界冠軍柯潔和中國象棋特級大師、北京隊主教練張強均向21世紀經濟報
導記者表示,軟體現已顛覆了棋類運動的部分理念和規律,終有一天人工智慧的棋藝會天
下無敵。
張強預測:「計算機將加速棋類運動的滅亡,甚至降低人類的創造性和毅力。」然而
,當下的計算機並非完美,從對弈棋局來看,目前系統仍存在計算錯誤、欠缺靈活性、規
律總結能力較差等弱點。
人腦對壘電腦
李世石逐步揣摩AlphaGO「心思」的5場對戰,也是大眾了解人工智慧的過程。在最後
一盤廝殺中,儘管李世石採用了與前四局不同的招數,然而「神之一手」並沒有出現,
AlphaGO最終獲勝,其技術實力和「棋感」有目共睹。
根據專家的公開分析,AlphaGO的成功來源於深度學習技術和蒙特卡洛樹演算法的結
合。蒙特卡洛樹搜索演算法是特別適合棋類遊戲的演算法。而對於盤面組合數極大的圍棋
,還需要深度學習這一新技術,深度學習本質是指人工神經網路,包括決定落子的「策略
網路」,評估局面勝算的「價值網路」。相比以往的窮舉法,是飛躍性的進展。
深度學習則是谷歌引以為豪的技術創新。日本函館未來大學教授、人工智慧學會會長
松原仁在接受21世紀經濟報導記者採訪時表示,AlphaGO在圍棋領域超越人類,是人工智
慧很大的突破。圍棋獲勝雖然沒有改變世界,但是這顯示了在其他領域超越人類的可能性
。他說道,「此次比賽中,谷歌開發的強大性能的電腦功不可沒。」
在不少業內人士看來,AlphaGO是通過深度學習得來的「機器棋感」來和人類的抽象
推理進行角力的。
浙江大學人工智慧研究院院長吳飛教授告訴21世紀經濟報導記者:「在第四盤比賽中
,李世石把旗子擺到了中盤,引向中盤,複雜度比較高。阿爾法狗近身鏖戰能力強,某個
棋子在中空地帶,可能出現棋子的步驟成千上萬,計算就失誤了,可能是演算法里沒有考
慮這個情景。BUG是人沒有教阿爾法狗這個特定的棋局,『神來之筆』則是人的一種動物
性。」
可以說,如今備受關注的棋局終結,外界對於人工智慧雖然強大,但也並非沒有弱點
已達成共識。
就在第四盤戰勝AlphaGo后,李世石曾在記者會上表示:「今天自己下出意外的招式
時,AlphaGo出現了某種形式的漏洞(BUG),對於意外招式的應對能力較為欠缺。」
谷歌DeepMind首席執行官丹米斯-哈撒比斯(Demis Hassabis)也通過社交平台承認
,李世石翻盤是因為擊中了機器人的BUG,下出白78手后,AlphaGo自我感覺良好,在程序
的「值網路」(用於評估電腦勝率)中,誤以為勝率達到70%,但直到第87步才反應過來
。
即使在AlphaGo獲勝的前兩局中,也並非完美。「前兩盤機器在布局上有一些小問題
,但由於李世石後面犯了錯誤,才把優勢拱手相讓了。」柯潔對本報表示。
圍棋如此,在中國象棋和國際象棋人機大戰中,計算機也沒能達到步步精確。中國象
棋人機大戰早在2006年就舉行過,但未受到高度關注。當年超級計算機天梭浪潮與中國五
位特級大師對弈,最終以3勝5和2負取得勝利。
親自上陣的張強取得1勝1和的戰績,他告訴21世紀經濟報導:「計算機有軟手、失誤
和計算不到位的情況,開局時我就略略佔優。即使發展到現在,也會存在BUG,不會步步
精準。」此外,1997年深藍雖戰勝國際象棋棋王卡斯帕羅夫,但也是僅以3.5比2.5獲勝,
其中也存在計算失誤情況。
而在另一方面,AlphaGo等人工智慧的缺陷還表現在欠缺靈活性和針對性。
哈撒比斯表示:「我們向它輸入網路上的對弈棋譜,使其逐漸學會下圍棋的通用範式
,並未輸入李九段的對弈棋譜,也沒有進行針對性訓練。」
截至目前,在「三棋」中尚無證據證明,計算機可以針對某一對手的特殊風格做出調
整,以取得更優結果。而這在實際對弈中卻極為常見,如對手善於平穩中取勝,則應將局
面引入混亂搏殺,反之亦然。
究其原因,是因為針對性出招可以使機器縮短獲勝時間並節省計算量,最重要的是有
助於降低BUG的出現率,這顯然會使機器變得更加聰明。「現實中備戰,棋手一定會研究
對手,力圖走出讓對手彆扭的棋。」柯潔直言。
而最後一個值得商榷的是,計算機的規律總結能力能否超越人類。
「人工智慧真是太了不起了,它每天都可以學習幾萬盤棋,這個數量是人類一生都無
法企及的數量。」柯潔表示。然而,這一可怕的優勢恰恰反映出機器總結規律的能力暫時
弱於人類。張強指出:「與機器相比,人類在少量記憶、訓練的情況下就能找到規律,從
而達到很高的水平。但機器卻需要輸入遠多於人類記憶極限的盤數才能具備相應水平。」
降低創造性致棋類消亡?
現如今,象棋人工智慧軟體主要包括天機、名手、旋風等。而早在AlphaGo登台亮相
之前的數年,象棋選手就已普遍使用類似人工智慧幫助提高棋藝。
張強告訴21世紀經濟報導:「以前出一個高手需要5-10年培養期,現在只要三四年了
。對棋類而言,人工智慧或許弊大於利。由於很多神秘面紗陸續被計算機解密,這雖可以
加速象棋的發展速度,但等到全部解密之後,象棋、圍棋就成了五子棋、跳棋那樣無趣了
。」
在與機器進行棋類遊戲的過程中,人們常常失去鬥棋的樂趣,主要存在兩方面原因。
一方面,機器下棋都存在「固化」思維,面對同樣的局勢,機器總是在同一處落子。松原
仁認為,AlphaGO也不例外,在多次的對戰中很有可能試出機器弱點從而取勝,「在交手
過程中棋手會繼續學習,但是AlphaGO並不會。」
另一方面,儘管谷歌聲稱AlphaGO擁有「大局觀」,但是對於「以退為進」、「亂中
取勝」等人類的棋類技巧以及團隊作戰時的配合協調方面,目前AlphaGO尚未實現。對此
松原仁指出,AlphaGO理解力上存在缺點,它會做出選擇,但是不能表達出確切的邏輯關
係和理由。
扼殺創造力之辯還體現在另一方面。目前,受到人工智慧的影響,象棋的訓練方法已
發生了巨大改變。張強解釋稱:「曾經是由棋手創造性地開發出新的招法,現在變成電腦
給出答案了。誰用電腦的時間長、方法得當,誰的水平就增長得快,這傷害了人類的創造
性和意志品質。」
類似的情況其實在AlphaGo與李世石的第二盤中就有所體現出來。
據柯潔回憶稱:「雙方交鋒第二盤的第37手,機器下出了人類從沒有走過的招法,開
始很驚訝,但後來仔細想想,這步棋是非常有道理的,甚至可以說是創造了一種布局變化
。」
棋手們普遍顯示出了對人工智慧的抗拒心理。「我是不是生不逢時了?」柯潔感嘆。
而對於與AlphaGo的對戰,柯潔也收回了此前百分百勝、六七成勝率的判斷,「現在說勝
率都是沒有意義的。」
(編輯:陳時俊,如有意見建議請聯繫:chensj@@21jingji.com)
http://news.sina.com.tw/article/20160317/16432943.html