[問題] 用R分析健保資料

作者: ecstasym (愛咳死在西)   2014-03-05 20:17:31
[問題類型]:
程式諮詢
我想用R 分析健保資料,但是連要怎麼用R 讀資料都寫不出來
[軟體熟悉度]:
入門(寫過其他程式,只是對語法不熟悉)
[問題敘述]:
老師丟了一筆健保教我用R試著分析 (老師自己是用SAS)
但我之前修過的課都沒有教得太難
大部分是社區型的小資料
健保資料是很大的一筆 .DAT檔案
內容超過 65萬筆資料,約 40個變項
目前上網找過,也看過一兩本R的書
但都沒有寫的很詳細
目前知道read.delim()可以讀進檔案,但是根本亂碼 XD
需要的幫助是希望高手們可以教教我怎麼可以讀這檔案
或是有沒有程式套件可用~
以上,希望各位幫幫小妹了
[關鍵字]:
健保資料
作者: obarisk (OSWALT)   2014-03-05 20:39:00
big5 utf8? 資料的分隔符號是? 關鍵字XD
作者: ecstasym (愛咳死在西)   2014-03-05 21:03:00
請問資料的分隔符號要從哪裡可以知道呢?
作者: gsuper (Logit(odds))   2014-03-05 21:04:00
你的問題應該不是R , 是要先找軟體把 .dat 檔換成 .txt檔
作者: ecstasym (愛咳死在西)   2014-03-05 21:34:00
http://ppt.cc/~3aa (資料用筆記本打開是長這樣的@@所以我需要的是宣告第幾個字元是哪個變數嗎??
作者: kokolotl (nooooooooooo)   2014-03-05 22:19:00
你要先知道每個位置代表啥意思 去找資料的codebook吧
作者: diplazium (diplazium)   2014-03-06 09:24:00
何不直接請老師給你CSV檔?
作者: onionsteven (.__ . )   2014-03-06 11:37:00
作者: braveht (衝吧衝吧)   2014-03-06 19:13:00
請安裝RStudio,點右上角的import dataset...
作者: kokolotl (nooooooooooo)   2014-03-06 19:51:00
這樣的資料型態我比較喜歡用stata來弄XD
作者: obarisk (OSWALT)   2014-03-06 23:15:00
看不出來資料長怎樣
作者: summitstudio (第凡斯米德費爾德)   2014-03-07 17:28:00
跟老師要codebook裡面有資料格式(健保資料是固定長度而不是用分隔符號這點比較麻煩,有codebook才作得動基本上一行(row)就是一個觀察值 然後用長度去切欄位或者懶人解法就是跟老師要已經讀好的 SAS dataset xD
作者: anovachen (@@)   2014-03-11 15:34:00
substr()
作者: gsuper (Logit(odds))   2014-03-23 00:37:00
#1HLjk2HI 參考一下我這篇筆記文 花個10天學一下資料處理資料處理本來就是分析中相當耗時的部分 不太可能一鍵解決

Links booklink

Contact Us: admin [ a t ] ucptt.com