※ 引述《sexonly (QQQ)》之銘言:
: 好像固定都會流行某些東西
: 早先一點是流行奈米
: 各式各樣的產品都要跟奈米扯上關係
: 最有名的當然就是五樓的奈米屌
: 之後則是流行雲端
: 只要摸到邊 廠商和政府的文宣都會有加上雲端兩個字
: 幾乎所有3C產品 都會冠上雲端
: e.g. 雲端伺服器 雲端攝影機 雲端硬碟 雲端情趣用品
: 最近則是流行BIG DATA
: 強調大數據 從數據中中挖寶
: 就連郭董也投入相關事業
: http://news.ltn.com.tw/news/business/breakingnews/1039611
: 但是不論 奈米 雲端 BigData 都不是什麼新概念
: 類似的東西早在上世紀就有相當程度的應用
: 為何會跟時尚業一樣 不定期被挖出來炒作???
: 有沒有最近什麼都要扯上Big Data???
這個讓本魯鍵盤資料科學家來解釋一下
從技術上來看 big data的興起跟hadoop有很大的關係
hadoop簡單說就是用成千上萬台伺服器組成一個儲存空間
再加上在地化平行運算技術 也就是資料存在哪台機器上就由他來算
不像傳統資料庫 要把資料搬到計算中樞處理
所以可以處理TB甚至PB等級的資料
又由於他只是一個檔案系統而不是資料庫 因此儲存資料的格式更具彈性
這個技術最早是由google發表概念並由Yahoo,臉書等公司一起發展的
早期都是在網路公司在用 所以很容易跟雲端服務結合在一起, 如Amazon
hadoop技術是在最近兩三年才開始走向一般商業化的 因此也炒熱了big data
至於除了資料量更大以外 跟data mining有什麼不一樣?
其實大部分演算法是差不多的 但是概念有一點不同
data mining 的想法是從資料中找到有用的商業知識 像是啤酒與尿布的案例
而big data更強調機器學習並研發成資料商品
像是google search或amazon 推薦系統這樣的服務
當然也有純粹當作資料倉儲在用的 現在台灣好像大部分還在這個階段