手癢也試了一下,就用data.table::foverlaps做
## data.table::foverlaps, reference: #1N_NLOIo
library(data.table)
library(magrittr)
dt <- fread('id start_y start_s end_y end_s
1 100 1 102 2
2 101 2 103 1
3 101 2 101 2') %>%
.[,{.(id=id,
start=as.numeric(paste(start_y,start_s,sep=".")),
end = as.numeric(paste(end_y,end_s,sep=".")))}] %>% setkey(start,end)
gt <- CJ(start_y=100:103, s=1:2) %>%
.[,{.(start=as.numeric(paste(start_y,s,sep=".")))}] %>% unique() %>%
.[,end:=start]
gx <- foverlaps(gt, dt, type="within", which=TRUE) %>%
.[which(!is.na(yid)),]
cbind(dt[gx$yid,.(id)], gt[gx$xid,.(start)]) %>% .[order(id),] %>%
.[,{.(id=id,
year=substr(start,1,nchar(start)-2),
s=substr(start,nchar(start),nchar(start))
)}]
# id year s
# 1: 1 100 1
# 2: 1 100 2
# 3: 1 101 1
# 4: 1 101 2
# 5: 1 102 1
# 6: 1 102 2
# 7: 2 101 2
# 8: 2 102 1
# 9: 2 102 2
#10: 2 103 1
#11: 3 101 2
※ 引述《criky (立業成家)》之銘言:
: [問題類型]:
:
: 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
: [軟體熟悉度]:
: 新手(沒寫過程式,R 是我的第一次)
: [問題敘述]:
: 若我有資料欄位如下:
:
: id start_y start_s end_y end_s
: 1 100 1 102 2
: 2 101 2 103 1
: 3 101 2 101 2
: year:
: 如何轉成下面的樣子:
: id year s
: 1 100 1
: 1 100 2
: 1 101 1
: 1 101 2
: 1 102 1
: 1 102 2
: 2 101 2
: 2 102 1
: 2 102 2
: 2 103 1
: 3 101 2 (只有一筆)
: 謝謝回答~
: [程式範例]:
:
:
: [環境敘述]:
:
: 請提供 sessionInfo() 的輸出結果,
: 裡面含有所有你使用的作業系統、R 的版本和套件版本資訊,
: 讓版友更容易找出錯誤
:
: [關鍵字]:
:
: 選擇性,也許未來有用
: