人機大戰再升級:百度大腦要參加《最強大腦》
繼今年 DeepMind AlphaGo 戰勝頂級圍棋選手李世石之後,百度 AI 百度大腦也要挑戰
人類,這次的比拼則通過一場科技類的電視節目——《最強大腦》。
12 月 16 日在《最強大腦》第四季新聞發佈後還沒結束的時候,百度大腦微信公眾
號已經率先推送了關於百度大腦將要參與到《最強大腦》欄目組比拼的消息內容,百度董
事長兼 CEO 李彥宏表示——這次參與到《最強大腦》比拼的“小度機器人”將代表“百
度大腦”和當今中國人工智慧的最高水準,與《最強大腦》名人堂的選手們約戰三場,爭
奪進入最終世界腦王爭霸賽的資格。
根據 PingWest 品玩在現場瞭解到的資訊,這次錄製將通過三場比賽三局兩勝制的方
式比拼,約戰領域將是圖像、語音辨識以及綜合識別三方面。在會後的溝通環節,百度深
度學習實驗室主任林元慶提到了其中一期比賽可能是“看大人的面孔找到童年的照片,或
是從童年的照片找到大人之類的比拼。”
李彥宏也提到——“百度大腦”擁有萬億級的參數、千億級別的樣本以及上億級別的
特徵訓練,它的工作機制和人腦有類似之處。不過人腦和機器的智慧適用於不同領域,北
京大學心理學系教授、博士生導師,也是這次活動的嘉賓魏坤琳提到,“人腦所擅長的,
都是後天學的,但是人腦不擅長搞記憶。其實像圍棋那樣非常複雜的任務,不是我們人類
非常擅長的,將來機器可能更容易超越,我們恰恰擅長的是感知和運動, 這一次挑戰是
拿了人類比較擅長的東西和機器打。”
復旦大學國際關係與公共事務學院博士、副教授,同為這次活動的主持人蔣昌建則認
為——每個項目當中,其實不單單是一個比如說人臉的辨識,也涉及到資料儲存的問題,
比如對初步的資料進行辨識以後儲存,也是一個記憶的問題,機器明顯的要在這個方面強
過人類。
人類在調動這些短期內記憶的這些東西的時候,可能就比機器弱,但是人類在最後挑
戰的時候最後所做的判斷是建立在儲存的資訊的基礎上進行人類比較擅長的分析,因此它
的優勢和它的弱勢之間形成一個平衡,也不是說人類完全占優。
要參與到這麼一場行銷和炫技兼得的大型電視真人秀節目中來也不是件容易的事情。
百度和《最強大腦》節目組兩方表示——這次節目組也找到了國內幾家頂級的技術互聯網
公司進行 PK 篩選,最後的結果是節目組更看中百度在方面的技術實力,所以才找到百度
大腦作為這次人機大戰的 PK 對象。
下面是會後林元慶、魏坤琳在採訪環節的內容精選。
記者:我對百度無人駕駛、深度學習都有一些瞭解。我想問一下小度機器人加入最強
大腦戰隊的出發點是什麼?是做深度學習測試,還是真正為了奪得某個獎項?因為有一個
背景是三月份 AlphaGo 和李世石那個對弈非常精彩,是不是會跟 AlphaGo 做一個對標呢
?
林元慶:百度在人工智慧這個領域確實投入非常大,特別是在公司內部。非常棒的是
最強大腦節目找到我們,看看我們能不能做這麼一檔節目,我們覺得是非常好的機會,來
看一看百度過去幾年研發的一些人工智慧技術已經到什麼樣的水準上。其實我們的目的不
是說來打敗人類的,更重要的還是檢驗我們自己——我們如果贏了,我們還是得繼續再研
發,把技術運用到實際產品上。輸了的話,還是回去做研發,希望研發出更好的技術。
記者:主要是從哪些方面跟人類去做一些對戰?
林元慶:比拼的方向主要是圖像識別和聲音識別。這兩個方向是人類比較擅長的,因
為人類是與生俱有的能力,圖像識別就是看的能力,聲音識別就是聽的能力,聽和看是人
類非常擅長的。整個人類的視聽系統應該說是非常好的。
魏坤琳:不過人腦所擅長的,也都是後天學的,但是人腦不擅長搞記憶。其實像圍棋
那樣非常複雜的任務,不是我們人類非常擅長的,將來機器可能更容易超越。我們恰恰擅
長的是感知和運動,很多老百姓不知道這一點:人類文明社會是一萬年前,一萬年前農耕
社會才發明了文字,後面才有人引以為傲的(各種發明的)東西,前面幾百萬年我們幹的
事情就是在狩獵和採集,如果(真的一直)在東非草原邊緣上幹了幾百萬年的話,唯一最
擅長做的事情,就是運動和感知覺。這一次挑戰是拿了人類比較擅長的東西和機器打。
蔣昌建:這裡面還有幾層意思。每個專案當中,其實不單單是一個比如說人臉的辨識
,也涉及到資料儲存的問題,比如對初步的資料進行辨識以後儲存,也是一個記憶的問題
。機器明顯的要在這個方面強過人類,人類在調動這些短期內記憶的這些東西的時候,可
能就比機器弱,但是人類在最後挑戰的時候,特別是我們的項目當中,最後所做的判斷是
建立在儲存的資訊的基礎上(進行人類比較擅長的分析),因此它的優勢和它的弱勢之間
形成一個平衡,也不是說人類完全占優。
記者:問蔣老師一個問題,剛才您說這檔節目的初衷並不是想要著重在於人腦和跟電
腦的對抗,人機大戰並不在於兩者之間的對抗…(那是在於什麼?)
蔣昌建:不關注誰輸誰贏,對節目組來講這不是我們最大的壓力,我們最大的壓力像
剛才魏坤琳講的,一個是怎麼建立一個公平的規則,能夠把人工智慧的機器人,它研究到
目前最好的潛力給表現出來。比如說機器人明明計算強過人類,比如說人在某些領域當中
的挑戰遠遠超過人工智慧現在的水準,基於一種目的的比拼都是不公平的。在專案的規則
的設計當中就要考慮這種平衡,把雙方的潛力都能夠發揮出來,這是我們最關心的第一個
問題。
第二個問題,在 PK 的過程當中,當然一定會有輸贏,因為要完成一個任務,但是輸
贏的背後看兩件事情。第一個有沒有給人工智慧提出新課題,還有是有沒有給像王昱珩、
王峰這樣頂尖的(最強大腦)選手提出新的挑戰。
第三個問題,我是一個有感情的人,你肯定問我作為主持人來講,跟節目有沒有關係
,如果人勝的話你的感情是什麼?如果機器勝的話呢?我非常矛盾,說老實話我是希望人
能夠勝利,但是當看到機器人在有一些局面是勝的時候,我的感情非常糾結。
我給你一個場面好了:當機器人在某些局勝的時候,機器人是不懂得高興的——他在
場上,但場下整個的研發機器人的團隊抱頭痛哭;當我看到人戰勝機器人的時候——我哭
了是人在哭。當我看到機器人戰勝人的時候,工程師團隊抱頭痛哭的時候也是人在哭,所
以你問我的心情,我可以這樣回答你,我在意什麼?其實我在意這些東西,我不是特別在
意輸贏。
記者:之前最強大腦節目組找過國內很多頂尖的互聯網公司和最強大腦進行一些合作
,今年 3 月份的時候搜狗這些王小川也參加過類似的節目,各個不同的互聯網公司對人
工智慧方面的研究有什麼樣的區別,百度的話可能就是說已經有一個小度(百度大腦)出
來了,比如阿裡或者搜狗這種,可能更多人工智慧還沒有一個形象化的東西出現,實際上
他們開發的方向可能有一些區別,在你看來的話國內現在的互聯網公司間,他們的區別在
哪裡,排名一二三的。
魏坤琳:首先大的互聯網公司佈局都特別大,過去一年之內發表的有關人工智慧的研
究中國人占了 1/4,其他的主要都是美國人,美國人中間有 80% 的研究是跟中國的合作
。你看知識的遷移,的確各大 IT 公司在後面的投入是非常大的,百度更加是恨不得把自
己的身家全都壓上去。其他公司可能還有很多重頭,而對於百度來說這個投入是非常大的
。
像搜狗、阿裡都有類似,但是他們做的可能比較有一些特定的領域,百度可能比較廣
一些。另一個百度的優勢——我不知道欄目組為什麼最終跟他們合作——我覺得有一個優
勢是在這幾個領域上面,語音辨識、聲音識別和圖像識別上,(百度)的確是目前國內做
的最好。別的公司可以噴我,但我看到了資料——百度參加其他的大賽,參加國際上的大
賽從來都是拿第一的,國內公司就是第一。去年 MIT 有個權威的十大科技突破,我看那
個新聞稍微驚訝一點,因為是整個科技領域在全球範圍內的突破其中有一項是百度的語音
辨識。
人工智慧到底離我們生活有多遠,比如自動駕駛離的比較遠。但是自動駕駛到現實生
活中可能它不是一個線性的發展,不是大概看的趨勢十年以後再看。科學發展不是這樣,
可能就是突然一個技術突然出現,突然一下有一個非線性的發展,第二天自動駕駛車就出
來了。所以不要用線性的思維預測離我們很遠。
我特別感到高興的一點,就是這次最強大腦能夠和他們強強聯手以後,過去我們老百
姓不明白科技界發展什麼事情,普羅大眾不太明白,我們做研究也不太明白人工智慧發展
是一個什麼趨勢,但是我們是不是通過這個形式在思想上早早給老百姓做一些鋪墊、準備
——這個東西到底強到什麼程度了。所以我們把人擅長的和機器做對比,我們看一看這個
東西的結果是怎樣,也是對老百姓非常好的科普。
第二點,剛才蔣老師講個人情感問題,這個問題提前給大家看更好,我們會跟人工智
慧之間產生情感的糾葛,這是遲早的事情,提前拿出來討論也很好。
記者:今天拿出來兩個人們比較喜聞樂見的專案語音辨識和圖像識別。百度在這兩個
項目,技術上面有沒有推出來的應用,就是已經有一個產品。
林元慶:人臉識別的話,剛才提到 2016 年之前做了互聯網圖片人臉的索引和搜索,
你搜魏坤琳會出來一串的魏坤琳的照片,那是因為我們對整個互聯網上面的照片都做了人
臉識別。大家可能平常會覺得——我搜魏坤琳應該就出魏坤琳,是因為很多的話全網的照
片都做了人臉識別。
記者:什麼時候開始的?
林元慶:過去這幾年一直都在做,開始的話應該在 2013 年左右。人臉識別在百度內
部已經用到百度的一個部門,互聯網金融很重要的就要能夠識別電腦前面或者手機前面這
個人是誰,就是身份認證。現在百度人臉識別已經用到了。
剛才我也提到下一步包括在外部的落地,就是 11 月初在烏鎮進駐景區刷臉就行了。
我們那個技術和大家市面上看到的人臉識別技術還不太一樣,人臉識別技術有兩種:一種
是一比一的比對,像銀行身份認證一般提交一個身份證,然後提交一張照片,系統會拿身
份證去公安的系統裡面取一張你的身份證的照片回來,現在的照片和身份證的照片進行比
對,看這是不是同一個人,這是一比一的比對。
我們烏鎮景區其實是更難的系統,是一比 N 的比對,只要你登記完之後,你的照片
已經在資料庫裡了,過這個閘機的時候不要再拿身份證,過的時候就得到你的人臉照片,
跟資料庫幾千人或者幾萬人去比較,甚至幾十萬人。原來是一張比一張,這個的話是一張
比幾千張或者幾萬張,我們叫一比 N 的比對,這個要做到非常高的精度還是非常難的。
記者:除了行業內的工作人員,其他的朋友會問這個真的能識別嗎?節目是不是也是
提前錄製好的?
林元慶:我們跟這個節目合作之後,就像今天做的這個比賽專案(識別童年照),我
們會把這項技術開放出來,這個會讓大家體驗。
這個節目從頭到尾都是一遍錄完,我們來之前只知道要挑戰什麼樣的內容(方向)—
—有的是拿小孩的照片去找大人,還是拿大人的照片找小孩,我們只知道這些。所有其他
具體比賽專案都非常保密,我們其實事先根本不知道。
記者:現在 AI 概念非常火。我很好奇的是前幾年 O2O 的概念也非常火,今年 AR、
VR 也非常火,現在已經證實了當年 O2O 有很多泡沫,很多公司已經死掉了。我想問的就
是,我之前去參加了很多 AI 和某些項目應用結合的發佈會,因為現在 AI 時代剛剛起步
,像百度這種頂級的技術互聯網公司也算是剛剛開始,如果說 AI 未來可能也是泡沫的話
,能不能說一下什麼樣的公司才是真正的 AI 公司,什麼公司實際就是假的,是泡沫?
林元慶:這個行業裡面,有一些泡沫,但 AI 確實是一下子能解決很多人解決不了的
問題。很多初創公司成立,同時有很多 Google、Facebook 這種重量級的公司也投入非常
大的力量做 AI,Google 也說他們是人工智慧公司了,不是搜索的公司,像百度也會覺得
人工智慧是我們的下一步。這裡面都有非常大的投入,但是非常重要的在於,是不是扎實
做事,這個是最重要的。比如技術方面,是不是研發了非常強的技術,技術是不是落地了
,你剛才說怎麼看哪一個公司不是真正的 AI 的公司,就要看這兩個方面,不要看融了多
少錢,現在融錢是容易的,更重要的是什麼場景,這個 AI 對它的推進到底有多大的幫助
。
記者:我聽到的是這個行業有做演算法的、做模型的,這種可能是真正在做技術提升
自己的實力,應用這方面更像是在套用一個成熟的模型,然後做 app 落地這種事情。現
在在做 AI 的初創公司,您能不能給我們做一個分類?
林元慶:還是不要給別人貼標籤,不太好。
記者:也不是具體提哪些公司,是不是有這種現象?
林元慶:是有的,有的公司做應用,有的公司做技術,可能把很多時間花在演算法上
,但是其實像人工智慧如果只做其中的一塊問題不大。人工智慧整個的研發體系,我說做
人工智慧很重要的一點是要有大應用,經常看到一些發佈會 PPT 上說人工智慧最近這幾
年比較這麼快,是因為深度學習、大資料、大計算,這三個肯定是很重要的——這三個能
夠搭建,能夠研發一些技術,直接用到某些產品。但是要把這些技術做到極致,接近百分
之百解決實際問題,一定要有技術研發出來,一定需要在市場反覆運算。為什麼反覆運算
很重要,不單單在於演算法的反覆運算,而在於資料。
有演算法有資料就會研發技術,技術變成產品,產品走到市場,使用者再用你的產品
提供無限資料,有更多的資料就能夠研發出越好的技術,就有越好的產品,就有越多的人
來用,這才是一個正迴圈,這個也非常重要。比如我只做演算法,前面後面不用,整個這
個技術就很難有非常大的發展。但是只做應用,沒有很好的技術驅動的話,手裡拿個資料
,可能資料也會比較慢,最重要的是把這個閉環用起來,這是我們在百度非常追求的事。
(王飛)