[關鍵字]:mlr、machine learning
[出處]:https://mlr-org.github.io/mlr-tutorial/release/html/
[重點摘要]:e1071、randomForest、caret這些知名的package來回調用
重要的machine learning function嗎? 相信一定會有覺得很煩,每個
function怎麼要求的都不同,有的input要matrix有的要全都是數字,都
沒有一個整合的平台可以使用嗎? 我這不就來了嗎。
mlr package是一個整合R上泛用常見的machine learning package的平台
可以讓你在一行之內的改變就可以access to大部分的機器學習演算法
[分享內容]:
## 首先你要先告訴mlr你現在的training data是誰,還有你想predict的
## column name,這篇文章我會以iris來作範例,假如是regression用regr代替
## classification則用classif,在iris是classification所以是classif
tsk <- makeClassifTask(data = iris , target = "Species")
## 這邊有一個argument叫ID,再後來是有其他用途的,但這邊我不設的話
## 他預設就是你的dataframe的名稱,Species是我們要預測的colname
## 接著我們可以開始訓練我們要的model了
mod <- train("classif.randomForest",task = iris)
## 這邊是最簡易的做法,使用train function給予他你learner的名稱與
## 上面我們賦予的task就能開始訓練,mlr接受直接使用""包含你的learning
## method,像是最簡單的線性回歸就叫做regr.lm,但是這種寫法你是使用
## default的參數,你才可以這樣做,若是你想要改變參數的話
lrn <- makelearner(...)
## makelearner function後面還有許多參數可以調整,可以自行參酌manual
## 最後到了predict的階段
output <- predict(mod,newdata = iris)
final <- output$data
## 這樣就可以得到最後的訓練結果了,在makelearner那部分可以修改predict type
## 將他設成prob就能得到機率結果囉,這邊是最最簡單的使用方法,基本上machine
## learning裡面不論是feature selection、missing value imputation、還有
## parameter tuning等等等功能全部都包含在這一個package裡面,希望能幫助到
## 想要使用R作為機器學習平台的使用者。需要更詳細的tutorial請參照來源,
## 寫的跟rstudio裡面的文章一樣的仔細,一步一步帶你做。