Re: [問卦] Big data跟統計有什麼差?

作者: stosto (樹多)   2015-09-02 21:26:21
大數據是人家創出來的新名詞唬你們用的,因為資料探勘做了幾十年不換新名詞沒題材
data mining才是主體,大數據沒意義,data mining 找出來的資訊才有意義
另外不用資料庫管理的基本知識也可以做data mining,是找出規則不是管理資料庫
data mining的核心在探勘演算法,有很多種,統計的方法可以拿來當成一種
另外你舉的例子是關聯規則演算法做出來的預測結果,這不是泡沫排序好嗎!
還有你排序可排出規則的話,相信我你會上IEEE,打臉那些fellow等級的教授
※ 引述《RonaldFisher (費雪)》之銘言:
: ※ 引述《apple123773 (逆水)》之銘言:
: : 不過假使您真的要學可能要先有資料庫管理的基礎再來說
: 你講的並不對
: 統計是統計 big data是big data
: 如果你將big data跟統計的相關 回歸這些扯上關係 就太小看big data了
: data mining是統計 time series / nonparametric / MANOVA 這些都是統計
: 是一種成熟的工具/手法
: big data就吾人所知就是辭意上的big data , 藉由大批量的數據去萃取出一些資訊
: 例如 時雨量 : 假設苗栗8月的觀測站有每個站點的時雨量記錄
: 假設有120個觀測站 8月共有31天 總共有89280組數據
: 這就是一組時雨量big data
: 你問我這個有甚麼用?? 單看一個月可能沒用 但是看完一整年365天共105萬筆data後
: 運用許多資料觀測手法會有些發現 : 舉例某站8月上限值固定卡在200毫米就上不去了
: 推估: 8月該觀測站雨量記錄可能故障了 / 實際調閱相關資料發現果然異常並作修復
: 顧名思義藉由分析大量資料去獲得個別甚至萃取出獨特資訊
: 需要的是強大的資料庫整理手法 or bubble sort概念 而不是統計
: 有錯再請確切使用神版友強大更正~
作者: RonaldFisher (費雪)   2015-09-02 21:29:00
bubble sort是基礎中的基礎概念 =_= 我沒說只用這個就可以排出規則..
作者: dos01 (朵斯01)   2015-09-02 21:30:00
這篇說的不錯
作者: myutwo150 (O51owtuym)   2015-09-02 21:34:00
bubble sort根本八竿子打不著邊 別凹了
作者: dos01 (朵斯01)   2015-09-02 21:36:00
從定義來說 統記範圍很廣 廣義來說有經過"運算"就算統記了
作者: drajan (EasoN)   2015-09-02 21:37:00
clustering的確是統計喔. 不管是K-means還是gaussianmixture 事實上都是從統計方法衍生出來的
作者: dos01 (朵斯01)   2015-09-02 21:38:00
另外趨勢、偏態那種把資料排在一起的也算統計
作者: stosto (樹多)   2015-09-02 21:39:00
你這樣講所有東西都是統計了
作者: myutwo150 (O51owtuym)   2015-09-02 21:43:00
你可以去看看Vapnik的頁面上統計一詞出現多少次再來說SVM是不是統計
作者: skizard ( )   2015-09-02 21:50:00
作者: stosto (樹多)   2015-09-02 21:53:00
對不起我錯了 我知識薄弱不知這些是統計學衍生出來的
作者: xxxg00w0 (寒夜)   2015-09-02 22:00:00
cluster不是統計有嗎?嗯……我怎麼覺得你提到的東西都有在統計看過的印象啊……抽樣方法那邊就有了SVM沒學過 來翻翻看好了
作者: limingche (dddooo)   2015-09-02 22:08:00
SVM是統計
作者: franktpmvu (fch)   2015-09-02 22:44:00
知識果然有他的深度 文無第一阿 做人還是謙虛的好

Links booklink

Contact Us: admin [ a t ] ucptt.com