[問題類型]:
Variable Importance
[軟體熟悉度]:
入門(寫過其他程式,只是對語法不熟悉)
[問題敘述]:
RandomForest的fit出來的model有一個importance
裡面的MeanDecreasingGini是用來判斷變數的重要性的指標
這個指標是一個平均值的結果
我想問的是
對於第i棵樹
要怎麼算出DecreasingGini值
在網路上參考了一篇文章 連結如下
https://goo.gl/6WSuoi
但這篇主要說明是Mean Decrease in Accuracy
不過概念上是很像
第一個step說: 隨機挑一些data與variable => 產生一棵樹
第二個step說: 將樹的模型用來預測沒有被挑到的data => 產生一個OOB-accuracy
第三個我就看不懂了
甚麼是permute variable i
有使用RandomForest的使用者能夠指導一下嗎?
不想似懂非懂認為這是重要指標
但不曉得如何而來
謝謝大家
[環境敘述]:
R version 3.4.3 (2017-11-30)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows >= 8 x64 (build 9200)
[關鍵字]:
Measures of variable importance in random forests
謝謝大家指導