[問題] xgboost regression

作者: clansoda (小笨)   2016-07-13 14:48:36
首先我先貼出資料
train
https://drive.google.com/file/d/0B3xY9FMzjybzZ1pCTDE1cE1yVmM/view?usp=sharing
test
https://drive.google.com/file/d/0B3xY9FMzjybzWUpzdmNmWlhwUmc/view?usp=sharing
這是一個hackthon上面的資料,我只是想用實際一點的資料來做我正在研究的package
train跟test都是數字資料是因為xgboost本身只吃數字資料,因此類別變數我全部都
轉成dummy variable,我用train data訓練一個random forest得到的RMSE在1179
但是我用相同的train data去訓練xgbooster然後predict,得到的RMSE居然2800多
已經是最後一名的邊都摸不到的那種,我覺得應該是我的code哪裡寫錯了,但是我看
vignette,我一開始是寫成classification的樣子,後來改成regression後卻跑出
負數的值,比用classification去跑更離譜,因此發文請教
xgboost(data = trainmatrix,label = train$Item_Outlet_Sales,max_depth=2
,eta=1,nthread=2,nrounds = 2,objective="reg:linear",booster="gblinear")->s
上面是我用來訓練xgbooster的語法跟參數,我一開始跟著vignette寫如果booster不寫
=gblinear好像會試classfication,多寫以後跑出來是負數。

Links booklink

Contact Us: admin [ a t ] ucptt.com