[問題] Excel字串的處理

作者: qazzzzz (小不點)   2014-10-30 17:07:19
[問題類型]:
程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
[軟體熟悉度]:
新手
[問題敘述]:
我的資料Excel檔裡面有兩個column,
第一個column他是id,第二的column是他的名字
因為他的名字都會有一些不必要的符號,
所以我想把一些符號改成空格
可是不太會用for loop...
請問要如何針對column 2 檢查每一個名字的每一個字母呢?
謝謝~
例如: 將"<" 及 ">" 變空格
┌───┬────┐
│ id1 │name<1> │ →name 1
├───┼────┤
│ id2 │n<2>tea │ →n 2 tea
├───┼────┤
│ id3 │juice<3>│ →juice 3
└───┴────┘
作者: koai (可笑的自以為...)   2014-10-30 17:51:00
gsub(">"," ",gsub("<"," ",data[,2]))
作者: Edster (Edster)   2014-10-30 22:34:00
如果是這樣你必須先定義什麼是要保留的文字.而什麼是要被取代的.比如說你可以定義 letters (英文字母) 是要保留的.其餘全部轉成空白.library(stringr)x = c("xz", "123", "gcb5c")y = rep(list(character(100)),length(x))for(i in 1:length(x)) for(j in 1:nchar(x[i]))y[[i]][j] = str_sub(x[i], j, j)unique(unlist(y))你就得到所有的字元, 再用上面的教學取代.
作者: obarisk (OSWALT)   2014-10-31 10:07:00
keyword regexp punctgsub("[[:punct:]]", "", string)

Links booklink

Contact Us: admin [ a t ] ucptt.com