大家好,想請教一個迴歸問題
一般在寫迴歸的語法是
lm(y~x1+x2+x3...),直接將變數名稱寫上。
但因為實作牽涉變數選擇的問題
我的寫法是用矩陣的方式
lm(data[,7]~data[,variable])
data是1000*7的矩陣,第7個是反映變數
variable是數字向量,作為變數選擇的指標
例如variable=c(1,2,4)是選取x1,x2,x4作為解釋變數
這樣的寫法雖然一樣可以建模型但沒辦法順利預測測試集
我的測試集是200*7的資料集
用predict預測會給警告訊息說新資料筆數只有200和原始資料筆數不同
並且回傳的預測結果是建模型那1000筆資料的fitted.value
這樣的狀況只有在使用矩陣寫lm時會產生,一般寫法就沒問題
目前只想到提取模型係數自己算的解決方案,請問是否有方法可以解決這樣的問題呢?