[問題] input data (非mxn)

作者: yaowei2010 (yaowei)   2014-10-23 19:10:48
[軟體熟悉度]:
新手(沒寫過程式,R 是我的第一次)
[問題敘述]:
input一個一開始行數不均的csv的data
[程式範例]:
我知道這問題有點蠢
但因為這個data它有1.5 GB
Excel打開到一半就掛了 還失去後面的一部分資訊
想說用R開並整理資料
沒料到這筆資料是長這樣的(在Excel看到前半部分資料)
例如:
xxx
xxx
xxx xxx ←這些xxx我都不要
xxx xxx
xxx xxx
Name ID A B C D ←從這行開始以下才是我要的資料
a b c d e f
g h i j k l
.
.
.
可是因為不是mxn 標準dataframe的格式 (假設我要的資料是m x n)
R loading進去之後就整個亂掉了 變成 k x 2
也就是我資料全部變成2個column全亂掉...
但我沒辦法開啟excel把不要的部分刪掉
請問這該怎麼辦QAQ
有什麼好建議 或挽救的整理方式
作者: Wush978 (拒看低質媒體)   2014-10-23 20:37:00
你如果知道前面不需要的資料的行數,可以用skip掉請使用skip這個參數
作者: andrew43 (討厭有好心推文後刪文者)   2014-10-23 20:39:00
skip=列數
作者: yaowei2010 (yaowei)   2014-10-23 21:03:00
感謝!!!!
作者: Edster (Edster)   2014-10-24 21:55:00
你可以用 Notepad++ 或 Notepad2 打開大的csv, 修改檔案.
作者: gsuper (Logit(odds))   2014-10-25 00:26:00
read.delim("",skip=10) 這樣應該可以另一種方式是用 scan("",what="character") 但這需要會寫程式才能做後續處理
作者: kenshin528 (成立奧凶帝國!!)   2014-10-25 14:44:00
read.table的時候 fill=TRUE看看

Links booklink

Contact Us: admin [ a t ] ucptt.com