[問題] 如何exclude 兩個vectors重複的數

作者: oliversu (oliver)   2016-01-24 14:30:21
[軟體熟悉度]:
入門
[問題敘述]:
我有兩個vectors
分別叫做 sampledata與controldata
controldat是從sampledata隨機取樣3750個
現在我想做一個treatmentdata是把 上述兩個vector重複的數字刪掉
然而,
因為sampledata裡面本身就有重複的數字
如果使用 setdiff這個函數就會發生重複數字被刪除兩次
例如
sampledata{2,3,2,7,5,8,9,8}
controldata{2,8}
預期得到結果 sampledata{3,2,7,5,9,8}
我也試過%in% 的方式,但發現都無法如預期
由於資料頗大,我無法確認%in%的問題出在哪
希望大家幫幫我
我才剛開始摸索R
感謝大家
作者: andrew43 (討厭有好心推文後刪文者)   2016-01-25 02:22:00
可以的話不要這樣想。應該先有一個包括所有資料的表格。其中這個表格必須有ID欄。你現在沒有ID,所以怎麼切都會不知道哪裡出問題。又因為你有ID欄,要切資料、取交集聯集都會容易很多。如果
作者: oliversu (oliver)   2016-01-25 14:09:00
謝謝,換個切入點思考就解決了

Links booklink

Contact Us: admin [ a t ] ucptt.com