PTT
Submit
Submit
選擇語言
正體中文
简体中文
PTT
R_Language
[問題] 用R分析健保資料
作者:
ecstasym
(愛咳死在西)
2014-03-05 20:17:31
[問題類型]:
程式諮詢
我想用R 分析健保資料,但是連要怎麼用R 讀資料都寫不出來
[軟體熟悉度]:
入門(寫過其他程式,只是對語法不熟悉)
[問題敘述]:
老師丟了一筆健保教我用R試著分析 (老師自己是用SAS)
但我之前修過的課都沒有教得太難
大部分是社區型的小資料
健保資料是很大的一筆 .DAT檔案
內容超過 65萬筆資料,約 40個變項
目前上網找過,也看過一兩本R的書
但都沒有寫的很詳細
目前知道read.delim()可以讀進檔案,但是根本亂碼 XD
需要的幫助是希望高手們可以教教我怎麼可以讀這檔案
或是有沒有程式套件可用~
以上,希望各位幫幫小妹了
[關鍵字]:
健保資料
作者: obarisk (OSWALT)
2014-03-05 20:39:00
big5 utf8? 資料的分隔符號是? 關鍵字XD
作者:
ecstasym
(愛咳死在西)
2014-03-05 21:03:00
請問資料的分隔符號要從哪裡可以知道呢?
作者:
gsuper
(Logit(odds))
2014-03-05 21:04:00
你的問題應該不是R , 是要先找軟體把 .dat 檔換成 .txt檔
作者:
ecstasym
(愛咳死在西)
2014-03-05 21:34:00
http://ppt.cc/~3aa
(資料用筆記本打開是長這樣的@@所以我需要的是宣告第幾個字元是哪個變數嗎??
作者:
kokolotl
(nooooooooooo)
2014-03-05 22:19:00
你要先知道每個位置代表啥意思 去找資料的codebook吧
作者:
diplazium
(diplazium)
2014-03-06 09:24:00
何不直接請老師給你CSV檔?
作者:
onionsteven
(.__ . )
2014-03-06 11:37:00
http://ppt.cc/Vsdp
作者:
braveht
(衝吧衝吧)
2014-03-06 19:13:00
請安裝RStudio,點右上角的import dataset...
作者:
kokolotl
(nooooooooooo)
2014-03-06 19:51:00
這樣的資料型態我比較喜歡用stata來弄XD
作者: obarisk (OSWALT)
2014-03-06 23:15:00
看不出來資料長怎樣
作者:
summitstudio
(第凡斯米德費爾德)
2014-03-07 17:28:00
跟老師要codebook裡面有資料格式(健保資料是固定長度而不是用分隔符號這點比較麻煩,有codebook才作得動基本上一行(row)就是一個觀察值 然後用長度去切欄位或者懶人解法就是跟老師要已經讀好的 SAS dataset xD
作者: anovachen (@@)
2014-03-11 15:34:00
substr()
作者:
gsuper
(Logit(odds))
2014-03-23 00:37:00
#1HLjk2HI 參考一下我這篇筆記文 花個10天學一下資料處理資料處理本來就是分析中相當耗時的部分 不太可能一鍵解決
繼續閱讀
Re: [問題] 一階導數微分
roussas
[問題] 在VC++ 2010中使用R
wu110011
[問題] 一階導數微分
silent910
[問題] homebrew安裝Rmpi
Dboy
[問題] 矩陣的範圍不能是負值
Dboy
[問題] R documention file如何生成
kingleo28
[問題] Decision Tree Plot 問題
ww2308
[問題] 畫圖問題
jack781012
[問題] 如何 impute missing data
kusoayan
[問題] 請問版上有人在用ShortRead/Biostrings嗎
Kurki
Links
booklink
Contact Us: admin [ a t ] ucptt.com