PTT
Submit
Submit
選擇語言
正體中文
简体中文
PTT
Gossiping
Re: [問卦] 大數據分析與統計分析的差別?
作者:
abc2090614
(casperxdd)
2017-10-18 10:58:10
沒什麼不同
唯一的差異在數據量大小
平常都是用spark在跑
前幾天跟同事想試用scikit learn跑個東西
他把json抓下來20G一塞進去python read_json
直接電腦黑屏給他看
兩周量而且已經篩過的的資料
正常一天大概有200~400G左右的data
光是要一個月的資料縮到能用統計方法來作就要花一番心力
然後處理時要跑多久又是另一個問題
只能在伺服器上跑
大數據其實光大這個字沒意義
難的是把雜亂無章的大數據整理成有用的小數據
接下來再用統計或ML還是啥其實方法都差不多
清data這塊大家方法差異比較大
作者: ghmsxtwo (YI)
2017-10-18 11:00:00
Json晚上打球
作者: AAQQUUAA
2017-10-18 11:00:00
那個賣場用大數據比當事人早知道懷孕的都市傳說成真了嗎
作者:
iiscon
(となりのぶたく)
2017-10-18 11:01:00
把尿布跟啤酒放在一起增加銷售量
作者:
ldeathkiller
(之之)
2017-10-18 11:04:00
Preprcess是最痛苦的部分
作者:
ChungLi5566
(中壢56哥)
2017-10-18 11:04:00
尿布啤酒那是Data Mining 不是大數據
作者:
rosenzulu
(玫瑰祖魯)
2017-10-18 11:11:00
那為什麼大家都推學python呢? 跑不動還用 沒道理啊
作者:
toy9986619
(幻飄)
2017-10-18 11:51:00
因為python的工具蠻多的,學起來很快吧spark也可以用python寫
繼續閱讀
[問卦] 關於睡覺
DwayneBacon
Re: [新聞] 遭爆和張正偉鬧離婚!鄭詩婷曾嘆說...
VVizZ
[問卦] 台灣棒球實力是不是沒酸民說的那麼差?
monine
Re: [問卦] 欸……文組是不是在台灣很難找工作
famas2200
[問卦] 如何說服父母讓自己離開軍校
sd4351224
[問卦] 有能力的人除了美國外,第二選擇是中國?
s72005ming
[問卦] 親戚小孩想打棒球 學喝酒來得及嗎
IslamicState
[新聞] 十九大/高雄出生的盧麗安致詞:我是台灣
XXXXGGYY
[新聞] 美國徵兵制擬大改 適齡男女皆須登記
eiw123
[FB] 人3 ALT盜圖?
kevin80112
Links
booklink
Contact Us: admin [ a t ] ucptt.com