統計是數學的分支
都有它的前提和假設
譬如迴歸要符合常態性,獨立性,同質性
但是實務上 99% 的人根本不想管也不懂這些數學假設
只想隨便丟一堆資料讓電腦跑
就說自己是專家
於是各種資料探勘方式就出來了
後來實務上又發現另外一個問題
實務上 99% 都不是結構化資料
統計上還要整理資料,刪除離群值或missing value等
對這些專家太麻煩了
它們就只是想把一堆垃圾資料丟到電腦裡面做而已嘛
有的甚至只是聲波
於是一堆垃圾全部丟進去就變成大數據了
※ 引述《rosenzulu (玫瑰祖魯)》之銘言:
: 大數據
: 最近被媒體使用到爛掉的名詞
: 常常看到新聞「大數據顯示...」
: 身為統計系的我 也稍微爬文瞭解一下
: 大數據的魅力所在
: 但看到的不外乎是
: 「未來產業大宗就是AI、物聯網與大數據的結合」
: 「運用大數據分析得到相關 進一步得知未來趨勢作為政策」
: 但如果是要探討相關性、做預測
: 使用統計方法不是也可以嗎?
: 再查一些大數據最夯的課程
: 幾乎都是R,Python這2個程式語言
: 然後使用該2語言實作資料探勘、機器學習
: 實在搞不懂大數據的新科技點在哪裡
: 有沒有產業界大數據大師可出來為小弟解惑?