[問題] 迴歸的預測問題 totolink PTT批踢踢實業坊

[問題] 迴歸的預測問題

作者: totolink (吐吐林克) 2020-08-17 12:13:45

大家好，想請教一個迴歸問題
一般在寫迴歸的語法是
lm(y~x1+x2+x3...)，直接將變數名稱寫上。
但因為實作牽涉變數選擇的問題
我的寫法是用矩陣的方式
lm(data[,7]~data[,variable])
data是1000*7的矩陣，第7個是反映變數
variable是數字向量，作為變數選擇的指標
例如variable=c(1,2,4)是選取x1,x2,x4作為解釋變數
這樣的寫法雖然一樣可以建模型但沒辦法順利預測測試集
我的測試集是200*7的資料集
用predict預測會給警告訊息說新資料筆數只有200和原始資料筆數不同
並且回傳的預測結果是建模型那1000筆資料的fitted.value
這樣的狀況只有在使用矩陣寫lm時會產生，一般寫法就沒問題
目前只想到提取模型係數自己算的解決方案，請問是否有方法可以解決這樣的問題呢？

作者: andrew43 (討厭有好心推文後刪文者) 2020-08-17 12:45:00

我會直接提出係數和新資料用矩陣乘法，自變數再多也不算麻煩。

繼續閱讀

Re: [問題] 使用windows batch用Rscript產excelkhaos [問題] 使用windows batch用Rscript產excelkhaos [問題] 擷取中文特定字串love11098787 [問題] 上傳Package到CRANChenEye Re: [問題] 關於平行運算totolink [問題] 匯出excel問題totolink [問題] 想請問此流程控制是否出錯 asdfrtg [問題] ggplot畫不出同類型的dataYangPeiHung [問題]資料處理之超級大表empireisme [問題] %>%的應用eco100