[問題] train 不平衡資料的方法 qwertad PTT批踢踢實業坊

[問題] train 不平衡資料的方法

作者: qwertad (qwertad) 2018-03-28 04:04:12

是這樣的最近想自己做一些練習
於是網路上找了一個dataset,
它的lebal 是1跟0 但是資料不平衡
1：0約2：8
一開始用決策樹，隨機森林跑acc都大概8成跟我都猜0差不多，precision 爆爛
大概知道有兩種做法
1.從資料下手
我試了down _sampled ，smote
2.從演算法下手
我試了xg boost 還有用keras 蓋神經網路
怎麼train 在測試集上的表現大概就是
acc ：0.83 ,
precision (預測1正確）：0.7
recall (1被預測出來的機率）：0.3
的水準，precision 有上升到0.7
想請問有什麼方法是可以將準確率,precision ，recall再提高的，特徵工程有做
資料集是用kaggle 上的信用卡違約

作者: sean50301 ( (づ′・ω・）づ) 2018-03-28 11:42:00

probability calibration?

作者: aszx4510 (wind) 2018-03-29 01:20:00

可以參考隔壁版 DataScience 最近才討論過這個問題

繼續閱讀

[問題] python github程式碼使用fed03715 [問題] 抓取excel圖表標題seafire [問題] 關於DataFrameagiwar [問題] 時間轉換webber1984 [問題] picamera 搭配 tk顯示jy0318m [閒聊] Python新手的學習目標tin0107 [分享] 用Python看Instagramaznchat100 Re: [問題] 程式求救ThxThx Re: [問題] 程式求救FakeGPS [問題] 第二本書的選擇FakeGPS