路人路過 講個自己知道的故事 我媽當年是台大醫學檢技術學系 她當年跟我說她的
分數可以上北醫醫科(我覺有點唬爛) 但因為台大名字太香了 加上當年就業前景不差
她就去唸了 沒想到等她畢業後 因為科技發展 許多自動化機器產生
造成他們領域的需求人數大幅下降 就業前景整個往下拉
這個故事我一直記在心裡 然後這波AI就是這種味道 這波AI所帶來的是生產力改善
而不是取代人類 簡言之 以前需要100個人才能做的一件事情 現在10個人或者1個人
就可以做到
舉個例子
我們之前在Disney 有做過一個類似生產力改善 目標在幫助ESPN運動頻道提高生產力
ESPN會去許多大大小學校做二級三級甚至四級運動做運動轉播 通常全美可能一天都有
上百場運動賽事 而ESPN團隊通常會需要很多camera man 每個攝影機會架在不同角度
抓不同細節 然後會有個主camera man用來切換各個不同攝影機視角 來達到運動轉播
那時候我印象中一個團隊假設要10個人才能做到的轉播服務 我們同事在研究如何
只要兩個人就可以辦到 原理就是所有camera上面用Computer Vision去追蹤不同區域
和不同細節 甚至球員 來取代原本人類攝影師的操作 剩下兩個人就可以去微調這些
不同攝影機的細節 當然這件事情不是這樣好做 比方以下AI Camera把裁判禿頭當
成足球 所以會不斷追蹤裁判的禿頭位置
https://www.youtube.com/watch?v=SPbTKfu0zUY
那回過頭來 這幾年AI為何能大幅改善?除了算法上外最大的原因就是機器的暴力解
多虧老黃提供超強計算機 現在很多效能改進就是資料暴力解 尤其在Transformer
這種架構可以吃很大的資料 以前train數據動輒幾GB就很了不起 現在許多train的數據集
都是>5TB以上
從李飛飛提出ImageNet當初用大量數據集來增加效能 那個時候數據集也不過1TB
但那個時間點已經引起許多效能上改進 加上最近各種self-supervise等架構
都甚至不需要有label data任何wild dataset都可以拿去做訓練 各家公司就瘋狂用
暴力解 最近的image/text數據集都是幾TB起跳
因此得到的結果就是如下