作者:
loveu8 (RA1-推廣)
2017-09-08 07:53:08針對第二點,即使有遺失值,盡量還是不要刪除該筆data如果未來會做到ML,ML是可以處理遺失值的
作者:
a3236852 (serena)
2017-09-08 08:37:00對我很有幫助 謝謝你~
作者:
loveu8 (RA1-推廣)
2017-09-08 08:39:00哦哦,原來是這樣,ML介入的話可以處理這塊還在想說,這些資料應該還是有用途的,應該還是有方式可以讓這些資料發揮作用,來源是這樣!哈。感謝~~
作者:
askia (過客)
2017-09-08 09:32:00你說的1&2是資料分析最重要的部份不過視覺化應該是在分析資料以後才做的事吧
極端值也要看看,到底是錯誤,還是該顧客是VIP等級,消費能力高如果data是關於網路購物,那社會科學有一種叫,RFM model,可以參考看看
作者:
sennacon (故鄉可以"正名"嗎)
2017-09-08 10:16:00怎麼覺得是我的前公司XD
作者:
Ekmund (是一隻小叔)
2017-09-08 11:06:00可以讓員工這樣玩 真是好公司QQ
這幾步驟就是單純做敘述統計啊 用ML之前 先簡單分析看一看資料長怎樣是很基本的事情 後面還有很多可以分析
資料分析精髓就是整理資料套公式和決策真的是老闆的事
作者: vfgce (小兵) 2017-09-08 14:22:00
缺漏值不多時,可以選擇刪除或填補...但比例太高時,就要小心填補了太多"假資料",對於之後的應用可能會造成影響....
作者:
loveu8 (RA1-推廣)
2017-09-08 15:23:00to f496328mm 學到東西了,哈,回家來看看to y800122155 , 是啊,很簡單的分析,以前從沒接觸過覺得還蠻有趣的,只是後面還是有原本東西要用,就放著了剩下就交給公司內專職的資料分析師,處理後續了~to vfgce , 還好經手的資料,還沒到這個程度,倒是有其他人遇到過,只好想辦法處理了,哈to askia , 是啊 , 只是有時候我們工程師沒有決策能力又無法有效說明的時候,視覺化存在是加強你前面1跟2的註釋一樣,加強擁有決策的人,信任你做出的資料~ (無奈XD)
ML處理遺失值,除了填補,還有一種是利用決策樹的概念,去進行預測
作者:
askia (過客)
2017-09-08 16:06:00to loveu8: 但是這個文章的標題是「分析」啊
作者:
subset (子集合)
2017-09-08 16:50:00視覺化在超過三維度的資料應該很難做到吧若是在N維的資料中 取出1~3維資料 又會看不到隱含的東西
作者:
subset (子集合)
2017-09-08 17:56:00願聽樓上指導
作者: ray39620 (Level up) 2017-09-08 18:27:00
作者: vfgce (小兵) 2017-09-08 19:18:00
決策樹,KNN或是均值,都是補值,缺漏項一多,模型可信度就要再考慮一下...視覺化要小心處理,一堆初學者都以為決策平面一定畫得出來..
missing value handling方法很多 每個case適用的處理方式不一定一樣 常常是需要做敘述統計去看一看狀況有時候看用的Algo不同 有的不補值可能結果還比較好
作者:
loveu8 (RA1-推廣)
2017-09-09 07:33:00感謝各位回饋,果然要一群人討論,進步最快阿~RFM 我有喵了一下,可惜沒有完全實作主要是商品與撈取的會員資料範圍區間才一年半還真的無法看出有效的回購時間,只好做出一張簡單的消費次數與金額級距表,解釋我們會員的消費能力不過等有機會在玩了(專案燒屁股中XD