PTT
Submit
Submit
選擇語言
正體中文
简体中文
PTT
R_Language
[問題] 分層抽樣是否適用於正負樣本差距過大時?
作者:
ciphero
(奶油焗蛋餃...:))
2015-07-09 01:22:27
[問題類型]:
意見調查(我對R 有個很棒的想法,想問問大家的意見)
[軟體熟悉度]:
入門(寫過其他程式,只是對語法不熟悉)
[問題敘述]:
這裡我想問的問題,比較偏重在處理資料時使用的抽樣方式是否適合?
問題如下:
假設我有一份資料集,樣子如下:
項次 col_1 col_2 col_3 ...... col_50 result
作者:
Edster
(Edster)
2015-07-09 02:35:00
這是錯誤的抽樣方法,樣本並不能代表母體的分配我不懂什麼叫跑不出來。這幾個字有很多想像,但通常跟樣本無關,除非結果不符預期。這時你該抽樣的對象應該是變數欄,而非樣本。
作者:
celestialgod
(天)
2015-07-09 13:35:00
我測試了一下隨機資料 rpart確實給出錯誤不過沒有給錯誤訊息 就完全沒有切割NODEsummary給出error: 1tree這個套件也不行我找到了 加control = rpart.control(cp = -1)可以強迫分
繼續閱讀
[問題] 隨機森林分群後的問題
gbd37
[問題] 資料搬移
psinqoo
Re: [問題] 讀入"鴴" "鸊鷉" 等怪字
leo0650
Re: [問題] 讀入"鴴" "鸊鷉" 等怪字
helixc
[討論] ggplot2不能疊圖或畫雙Y軸圖?
helixc
Re: [問題] 讀入"鴴" "鸊鷉" 等怪字
Neisseria
Re: [問題] 讀入"鴴" "鸊鷉" 等怪字
helixc
[問題] openair安裝問題(dplyr)
dreler1
Re: [問題] 讀入"鴴" "鸊鷉" 等怪字
celestialgod
[問題] 讀入"鴴" "鸊鷉" 等怪字
helixc
Links
booklink
Contact Us: admin [ a t ] ucptt.com