[問題] 關於randomforest

作者: hatemath1991 (hatemath)   2017-09-27 23:09:00
[問題類型]:
意見調查(我對R 有個很棒的想法,想問問大家的意見)
程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
[軟體熟悉度]:
請把以下不需要的部份刪除
使用者(已經有用R 做過不少作品)
[問題敘述]:
抱歉有一些關於randomforest使用上的問題想要問一下
目前我使用randomForest這個套件去訓練我的樹
然後想要使用https://github.com/araastat/reprtree/tree/master/R
上面那個套件的retree畫出我的樹
但是遇到了一些問題
訓練組跟測試組所畫的樹不一樣
以及如果我現在是想要做隨機森林的特徵選取
那我該如何下手因為用不同的資料所會出的樹不一樣
[程式範例]:
請把以下不需要的部份刪除
library(reprtree)
rforest <- randomForest(type~., data=train_data)
reptree <- ReprTree(rforest, train_data, metric='d2')
plot(reptree, index=1)
reptree <- ReprTree(rforest, test_data, metric='d2')
plot(reptree, index=1)
[環境敘述]:
R version 3.4.1 (2017-06-30)
Platform: x86_64-pc-linux-gnu (64-bit)
Running under: Ubuntu 16.04.3 LTS
Matrix products: default
BLAS: /usr/lib/libblas/libblas.so.3.6.0
LAPACK: /usr/lib/lapack/liblapack.so.3.6.0
locale:
[1] LC_CTYPE=zh_TW.UTF-8 LC_NUMERIC=C
LC_TIME=zh_TW.UTF-8
[4] LC_COLLATE=zh_TW.UTF-8 LC_MONETARY=zh_TW.UTF-8
LC_MESSAGES=zh_TW.UTF-8
[7] LC_PAPER=zh_TW.UTF-8 LC_NAME=C
LC_ADDRESS=C
[10] LC_TELEPHONE=C LC_MEASUREMENT=zh_TW.UTF-8
LC_IDENTIFICATION=C
attached base packages:
[1] stats graphics grDevices utils datasets methods base
loaded via a namespace (and not attached):
[1] compiler_3.4.1 tools_3.4.1
[關鍵字]:
隨機森林、特徵選取、繪圖
作者: f496328mm (為什麼會流淚)   2017-09-27 23:35:00
為什麼要建兩次 model ?
作者: hatemath1991 (hatemath)   2017-09-27 23:37:00
抱歉我不是只用randomForest創一次model嘛?
作者: f496328mm (為什麼會流淚)   2017-09-27 23:51:00
應該是說 為什麼要分別對對 train and test 畫樹建 model 時, 是利用 train data 去建立樹model所以整個結構是看 train data
作者: hatemath1991 (hatemath)   2017-09-28 00:00:00
應該說這個是因為有一天打錯所以才發現的我原本想說是不是我演算法理解錯誤,但是回去重看林軒田老師的影片確定應該不會因為資料不同產生不同樹才對所以才會慘生疑問*產所以現在才會疑惑,為什麼兩顆樹的結構有差異
作者: KKbiger (UUUU)   2017-09-28 10:03:00
為什麼會覺得train data和test data建出來的數結構會完全一樣 除非你的train data建出來的model會百分之百可以預測test data 才有可能兩個一樣吧
作者: owem0410 (閒學生)   2017-09-28 11:56:00
抱歉我model才建一次不是?同model解構不就要一樣?
作者: KKbiger (UUUU)   2017-09-28 14:37:00
用train data抽了一棵樹 又用test data 抽出另一棵樹所以抽出兩顆不一樣的樹
作者: APM99 (血統純正台北人)   2017-09-28 16:45:00
你這樣做就沒有 訓練集跟測試集的意義了只是單純的畫了兩棵樹
作者: clansoda (小笨)   2017-09-28 16:58:00
這邊也看的到APM99??

Links booklink

Contact Us: admin [ a t ] ucptt.com