[問題] 關於Logistic迴歸的問題

作者: hatemath1991 (hatemath)   2017-06-15 01:03:50
[問題類型]:
程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
[軟體熟悉度]:
請把以下不需要的部份刪除
新手(沒寫過程式,R 是我的第一次)
[問題敘述]:
想要訓練一個高維度資料的Logistic迴歸模型,但是在後面的特徵卻都出現NA
就是summary之後對於個特徵如下面的圖,這是因為glm沒辦法處理太多特徵?
https://goo.gl/aJJNca
[程式範例]:
train_sample<-sample(40,30)
train_data<-temp[train_sample,]
test_data<-temp[-train_sample,]
model<-glm(type~.,family=binomial,data=train_data)
[環境敘述]:
R version 3.4.0 (2017-04-21)
Platform: x86_64-pc-linux-gnu (64-bit)
Running under: Ubuntu 16.04.2 LTS
Matrix products: default
BLAS: /usr/lib/libblas/libblas.so.3.6.0
LAPACK: /usr/lib/lapack/liblapack.so.3.6.0
locale:
[1] LC_CTYPE=zh_TW.UTF-8 LC_NUMERIC=C LC_TIME=zh_TW.UTF-8
[4] LC_COLLATE=zh_TW.UTF-8 LC_MONETARY=zh_TW.UTF-8 LC_MESSAGES=zh_TW.UTF-8
[7] LC_PAPER=zh_TW.UTF-8 LC_NAME=C LC_ADDRESS=C
[10] LC_TELEPHONE=C LC_MEASUREMENT=zh_TW.UTF-8 LC_IDENTIFICATION=C
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] ROCR_1.0-7 gplots_3.0.1
loaded via a namespace (and not attached):
[1] compiler_3.4.0 class_7.3-14 tools_3.4.0 KernSmooth_2.23-15 gdata_2.18.0
[6] caTools_1.17.1 bitops_1.0-6 gtools_3.5.0
[關鍵字]:
選擇性,也許未來有用
作者: Edster (Edster)   2017-06-15 09:07:00
狀況描述不清, 請問樣本樹跟變數分別的數量?
作者: hatemath1991 (hatemath)   2017-06-15 09:52:00
樣本數158。總共198個特徵
作者: Edster (Edster)   2017-06-15 10:34:00
那答案很明顯了吧.請用兩個點在三維空間畫立體圖看看.
作者: hatemath1991 (hatemath)   2017-06-15 11:22:00
我現在用一百個變數還是一樣大概在三十個後面都是NA??
作者: Edster (Edster)   2017-06-15 11:58:00
作者: f496328mm (為什麼會流淚)   2017-06-19 00:26:00
簡單來講就是 變數比方程式多 那一定解不出來用 forward selection 試試看?反正最後不好的變數還是要丟掉
作者: say29217074 (:)))))   2017-07-13 18:58:00
先降維

Links booklink

Contact Us: admin [ a t ] ucptt.com