[問題類型]
程式諮詢
[軟體熟悉度]
入門(寫過其他程式,只是對語法不熟悉)
[問題敘述]:
我想要把欄位中的**區擷取出來,網路上看到很多正規式的方式,但因為資料格式不太一致,無法用選位置的方式,想請假板上的神人應該怎麼寫,先感謝了!
[程式範例]:
https://i.imgur.com/6AwcUJ8.jpg
[環境敘述]:
R 3.6.0
[關鍵字]:
字串擷取
作者:
andrew43 (討厭有好心推文後刪文者)
2020-08-05 16:49:00我建議直接列舉所有直轄市的區名去抓,比純靠reg exp的邏輯還穩當。
作者:
locka (locka)
2020-08-05 16:59:00推Andrew大!有的區是三個字(ex:那瑪夏區)直接用清單比對比較不會錯
作者:
andrew43 (討厭有好心推文後刪文者)
2020-08-05 18:07:00感謝A大!!!成功了遇到character(0)要怎麼刪除,我用data[length(data$region)>0]發現刪不掉
作者:
andrew43 (討厭有好心推文後刪文者)
2020-08-06 14:33:00`data`是list嗎?用雙重中括號更正,試試在我的code後res[sapply(res, length) != 0]
data是資料框character(0)還是無法刪除
作者:
andrew43 (討厭有好心推文後刪文者)
2020-08-06 15:04:00請以code重現你的操作。
data$region[sapply(data$region,length)!=0]
作者:
andrew43 (討厭有好心推文後刪文者)
2020-08-06 15:28:00沒有完整重現困難的code與假資料實在無能為力
作者:
andrew43 (討厭有好心推文後刪文者)
2020-08-06 15:58:00試試用x<-character(0); identical(x, character(0))去一個一個檢驗。x應對應一個cell而非一整個column。
找到方法了,在前面資料處理的時候拿掉不要的字串,之後就不會出現了,感謝你!