大數據的定義就是
收集到足夠多的資料就叫大數據
大數據難的不是資料量
難的是你要用什麼樣的數學模型
去知道某兩筆以上的離散數據
有到什麼樣程度的關係性(依不同的數據有不同的檢定方式)
※ 引述《ilovedandan (歐陽妮妮忠實熱血粉絲)》之銘言:
: 最近新聞上真的很常看到這個名詞 Big data
: 身邊的人也常用到這個詞
: 但有點想問統計跟大數據有甚麼不一樣?
: 因為總覺得現在人家口中說的"big data"
: 不過就是一般個人電腦用EXCEL就跑得出來的統計結果而已嗎?
: 那跟以往的統計有啥不一樣?
沒有不一樣,大數據分析就是用統計分析
: 畢竟一般人能取到的資料庫就這麼大而已
: 而且分析出來就跟以往一樣,最後也找不出甚麼因果關係
個人問題
: 但報告的時候講出Big data好像很厲害耶
: 所以實在很好奇這兩者有甚麼不同
巨大量的數據你硬要分析其中的前因後果,理論上做的到
但通常都是npc以上的難度
除非量子電腦實作化,不然以人類有限的資源無法做到這件事
回到大數據的分析方式
你要用什麼樣的數學模型,用什麼樣的檢定指標?
大家都知道資料量只要足夠多,就可以有一定信心水準的準確度來
做到未來預測一件事到一個門檻準確度
問題是how to do this? how could it be?
巨大數據分析的定義是足量的數據
足量的數據是足量以分析到所需準確度以上的的足量
所以我反問你,你需要多大量資料去統計? 你要用什麼指標去分析? 然後達到多準的預測?