https://www.bnext.com.tw/index.php/article/42907/ai-can-code
工程師注意!「會寫AI程式的AI」來了
數位時代
認圖片、辨聲音、下圍棋、玩德州撲克、開卡車……似乎越來越多人能玩的事情AI也能玩
而且玩得比人還溜。但暫時有一部分人還是自我感覺安全的——工程師的工作AI還是很難
勝任的對吧?畢竟這個東西需要邏輯思考,需要框架和流程設計,哪裡是AI能一下子勝任
的事情。但Google等公司認為,AI現在可以開始學習一些AI專家做的事情了,那就是寫AI
程式。
Google Brain人工智慧研究小組的研究人員最近就進行了這樣的嘗試。他們在一次試驗中
讓軟體設計了一套機器學習系統,然後對這套系統進行測試語言處理方面的測試。結果發
現該系統的表示超過了人類設計的軟體。
Google Brain團隊首先用遞歸神經網絡(RNN)生成神經網絡的描述,然後利用強化學習
對該RNN進行訓練。其方法可以讓AI從零開始設計出一個新穎的神經網絡架構,在利用
CIFAR-10數據集(含6萬張32x32的彩圖,涉及10類對象,每一類各6,000張。其中5萬張為
訓練圖像,1萬張為測試圖像)進行圖像識別測試時,其識別的精度甚至比人類設計的最
好架構還要高,錯誤率僅為3.84%,與目前最先進的神經網絡模型相比,其錯誤率僅低0.1
個百分點,但速度快了1.2倍。而在用於自然語言處理的Penn Treebank數據集上,其模型
構造出來的一種遞歸神經單元也超越了被廣泛使用的LSTM神經單元等最新基準指標,在複
雜度方面比後者好3.6倍。
類似地,Google的另一個AI團隊DeepMind最近也發表了一篇名為《學會強化學習》的論文
。其研究同樣針對的是深度學習所需的訓練數據量大且獲取成本高的缺點。他們提出了一
種名為deep meta-reinforcement learning的強化學習方法,利用遞歸神經網絡可在完全
有監督的背景下支援學習的特點,把它應用到了強化學習上面。從而將用一個強化學習算
法訓練出來的神經網絡部署到任意環境上,使得AI在訓練數據量很少的情況下具備了應用
於多種場景的學習能力。或者用DeepMind團隊的話來說,叫做「學會學習」的能力,或者
叫做能解決類似相關問題的歸納能力。
Google Brain團隊的負責人Jeff Dean最近在回顧AI進展情況時,就曾經表態說機器學習
專家的部分工作其實應該由軟體來負責。他把這種技術叫做「自動化機器學習」,並認為
這是最有前途的AI研究方向之一,因為這將大大降低AI應用的門檻。
當然,創建「學會學習」的軟體這個想法由來已久,蒙特利爾大學的Yoshua Bengio早在
1990年代就提出了這個想法。但之前的試驗結果並不理想,因為AI做出來的東西還是比不
上人類想出來的模型。但近年來隨著運算能力的不斷增強,以及深度學習的出現,AI學會
學習的能力終於取得了突破。
儘管AI的自學能力取得了突破,但是在近期內還不能大面積推廣。因為事先這種能力需要
龐大的計算資源。比方說Google Brain那個設計出識別率超過人類所開發系統的圖像識別
系統的AI就需要800個GPU。
但這種情況將來可能會發生變化。最近MIT Media Lab也開發出了設計深度學習系統的學
習軟體,其所開發出來的深度學習系統的對象識別率也超過了人類設計的系統。 MIT
Media Lab計劃將來把它的這套AI開源出來,讓大家繼續這方面的探索。
除了Google和MIT以外,據報導最近幾個月有好幾個小組也在讓AI軟體學習編寫AI軟體方
面取得了進展。其中包括了非盈利的AI研究組織OpenAI (其他的非盈利AI組織可參見這
裡)、MIT、加州大學、柏克萊分校等。
一旦這類自啟動式的AI技術具備實用性,機器學習軟體在各行業應用的節奏無疑將大大
加快。因為目前機器學習專家極為短缺,各家企業組織都需要高薪供養這批人。