[問題] dcast整理表格後,空值的處理

作者: thephone (phone)   2015-11-11 23:21:53
手中有一筆消費數據
消費者 消費金額
A 170
A 230
A 490
A 490
A 490
B 610
B 459
C 300
C 211
C 200
依照消費金額區間切割
分別count不同區間的次數
如下
消費者 below100 100 200 300 400 500 600 700 ...30000
A 0 1 1 0 3 0 0 0 0
B 0 0 0 0 1 0 1 0 0
C 0 0 2 1 0 0 0 0 0
我的方法是將消費金額除100取整數
再用dcast(消費者~消費金額)
但是有些金額區間是空值(像上例中500的這個區間,不存在任何一位消費者)
dcast無法補0
想要讓col有連續
有其他建議的方法嗎?
謝謝
作者: celestialgod (天)   2015-11-11 23:37:00
dcast.data.table有 drop=FALSE記得要取成factor就好
作者: thephone (phone)   2015-11-12 10:01:00
好的 我試試看 thx
作者: celestialgod (天)   2015-11-12 23:42:00
sweep(as.matrix(dd), 2, colSums(dd), '/')大概長這樣,untested
作者: thephone (phone)   2015-11-13 10:48:00
學到了sweep 謝謝c大後來看到prop.table也可以使用

Links booklink

Contact Us: admin [ a t ] ucptt.com