Re: [問題] pandas 問題

作者: lance5487 ( )   2018-02-05 22:31:58
不好意思,想再問另外一個問題
df= UserID time
A 16:01
A 16:03
A 16:04
A 16:07
A 16:08
B 17:10
B 17:11
想計算每個USER最近值相剪的數列
也就是
A 2=16:03-16:01
A 1=16:04-16:03
A 3=16:07-16:04
B 1=17:11-17:10
※ 引述《lance5487 ( )》之銘言:
: 不好意思,小弟是pandas新手,想請問pandas的問題,請各位大大幫幫小弟忙QQ
: 假設今天有一個df
: df= UserID time
: A 16:01
: A 16:03
: A 16:04
: A 16:07
: A 16:08
: B 17:10
: B 17:11
: 想統計根據groupby UserID後 以 X 分鐘時間內統計的平均,眾數,最大值
: 假設以五分鐘為例
: A
: 16:01 5分鐘後為 16:06 => 共 3 筆 (16:01,16:03,16:04)
: 16:03 5分鐘後為 16:08 => 共 4 筆 (16:03,16:04,16:07,16:08)
: 16:04 5分鐘後為 16:09 => 共 3 筆 (16:04,16:07,16:08)
: 16:07 5分鐘後為 16:12 => 共 2 筆 (16:07,16:08)
: 16:08 5分鐘後為 16:13 => 共 1 筆 (16:08)
: 平均:(1+2+3+3+4)/5=3.6
: 最大值:4筆
: 眾數:3筆
: 最後整理成
: USERID 平均 眾數 最大值
: A 3.6 3 4
: B 1.5 1或2(1.5是最好) 2
作者: goldflower (金色小黃花)   2018-02-06 05:41:00
作者: lance5487 ( )   2018-02-06 06:43:00
查到了 好像用groupby跟diff就可以了原本想說關鍵字不好下 囧
作者: goldflower (金色小黃花)   2018-02-06 10:11:00
喔喔沒看到要用user分

Links booklink

Contact Us: admin [ a t ] ucptt.com