不好意思,想再請問一個問題QQ 問題不太好描述,容我用舉例的@@
USERID .... COLUMNA
A 10
A 20
A 30
A 40
A 80
B 20
B 30
B 40
我想問的是 我想給columnA設一個門檻值,根據UserID去區分達到門檻的比例
假設我設的門檻是一個array{20,40,80},然後回傳一個DataFrame,如下所列
USERID THRESHOLD<=20 THRESHOLD<=40 THRESHOLD=80
A 2/5=0.4 4/5=0.8 5/5=1
B 1/3=0.33 3/3=1 3/3=1
. . . .
. . . .
. . . .
一個column會寫,但多個column只能暴力解一直join,有沒有比較簡潔的用法
一個column的寫法是
df.groupby('USERID').apply( lambda x: ((x['COLUMNA']<=20).sum())/len(x))
如果可以的話,盡量不要用到for,用for的效率比較差,但有for的解法也可以啦XD