[問題] 迴歸的預測問題

作者: totolink (吐吐林克)   2020-08-17 12:13:45
大家好,想請教一個迴歸問題
一般在寫迴歸的語法是
lm(y~x1+x2+x3...),直接將變數名稱寫上。
但因為實作牽涉變數選擇的問題
我的寫法是用矩陣的方式
lm(data[,7]~data[,variable])
data是1000*7的矩陣,第7個是反映變數
variable是數字向量,作為變數選擇的指標
例如variable=c(1,2,4)是選取x1,x2,x4作為解釋變數
這樣的寫法雖然一樣可以建模型但沒辦法順利預測測試集
我的測試集是200*7的資料集
用predict預測會給警告訊息說新資料筆數只有200和原始資料筆數不同
並且回傳的預測結果是建模型那1000筆資料的fitted.value
這樣的狀況只有在使用矩陣寫lm時會產生,一般寫法就沒問題
目前只想到提取模型係數自己算的解決方案,請問是否有方法可以解決這樣的問題呢?
作者: andrew43 (討厭有好心推文後刪文者)   2020-08-17 12:45:00
我會直接提出係數和新資料用矩陣乘法,自變數再多也不算麻煩。

Links booklink

Contact Us: admin [ a t ] ucptt.com