Re: [問題] 一筆資料轉多筆

作者: memphis (讓你喜歡這世界~)   2016-12-02 15:30:49
我只有普通版的
library(dplyr)
tmp <- data.frame(id=c(1,2,3), start_y=c(100,101,101), start_s=c(1,2,2),
end_y=c(102,103,101), end_s=c(2,1,2), stringsAsFactors=F)
myfun <- function(v){
v <- as.vector(v)
out <- data.frame(id=v[1], year=rep(seq(v[2], v[4]), each=2),
s=c(1,2), stringsAsFactors=F)
if(v[3]==2) out <- out[-1,]
if(v[5]==1) out <- out[-nrow(out),]
return(out)
}
tmp2 <- apply(tmp,1,myfun)
#out <- do.call("rbind", tmp2)
out <- bind_rows(tmp2)
out
※ 引述《criky (立業成家)》之銘言:
: [問題類型]:
:
: 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
: [軟體熟悉度]:
: 新手(沒寫過程式,R 是我的第一次)
: [問題敘述]:
: 若我有資料欄位如下:
:
: id start_y start_s end_y end_s
: 1 100 1 102 2
: 2 101 2 103 1
: 3 101 2 101 2
: year:
: 如何轉成下面的樣子:
: id year s
: 1 100 1
: 1 100 2
: 1 101 1
: 1 101 2
: 1 102 1
: 1 102 2
: 2 101 2
: 2 102 1
: 2 102 2
: 2 103 1
: 3 101 2 (只有一筆)
: 謝謝回答~
: [程式範例]:
:
:
: [環境敘述]:
:
: 請提供 sessionInfo() 的輸出結果,
: 裡面含有所有你使用的作業系統、R 的版本和套件版本資訊,
: 讓版友更容易找出錯誤
:
: [關鍵字]:
:
: 選擇性,也許未來有用
:
作者: celestialgod (天)   2016-12-02 15:35:00
apply應該會慢到想哭
作者: memphis (讓你喜歡這世界~)   2016-12-02 15:49:00
我只會這招阿..如果資料量很大 apply 直接改成平行就好
作者: f496328mm (為什麼會流淚)   2016-12-02 15:53:00
我以前也是用apply開平行,但上面那些大大的方法,真的會比較好,我現在也很少開平行了我以前也是自己寫函數去做,不過資料量大,開平行還是慢,真的會跑到想哭
作者: celestialgod (天)   2016-12-02 16:08:00
看有沒有人要來個benchmark
作者: memphis (讓你喜歡這世界~)   2016-12-02 16:38:00
我猜你的應該會快吧 準備一個清單用框的 好像步驟比較少
作者: huangsam (sam)   2016-12-02 20:01:00
可以問一下平行慢的原因嗎?
作者: obarisk (OSWALT)   2016-12-02 20:04:00
平行運算有其它cost但樓上大大應該是指自己平行比用別人寫好的非平行慢
作者: celestialgod (天)   2016-12-02 20:47:00
沒有平行的程式多數背後是c++而非R,會相對快樂不少而且windows的R平行是開slave,需要花不少時間傳資料,linux的multicore,我就不確定了
作者: f496328mm (為什麼會流淚)   2016-12-03 12:02:00
背後是C++的真的很快 樓上說到重點 平行要傳資料傳資料佔記憶體,如果資料佔1G就好,平行開8核心就會佔8G,光傳資料就死人了,況且你還要做運算況且有些C++寫的好,會幫你用8核心去跑CPU常常跑到100%真的很爽XD當然平行是沒有辦法中的辦法 我有的時候還是會用

Links booklink

Contact Us: admin [ a t ] ucptt.com