[問題] 不同資料集欄位比對,再輸出比對結果

作者: joson4921 (特務)   2016-12-25 17:46:05
- 問題: 當你想要問問題時,請使用這個類別。
[問題類型]:
程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
[軟體熟悉度]:
入門(寫過其他程式,只是對語法不熟悉)
[問題敘述]:
手邊有兩個資料集,分別是 data1 (預計發車時間), data2 (實際發車時間)
我想做的事情是根據起站發車班表 data1 ,寫個判斷式進行時間比對
先上兩個資料集的格式與內容示意
data1 data2 預期結果
Bus_No. DepartureTime DepartureTime Bus_No.
1 5:50 2015-12-25 06:51:20 4
2 6:10 2015-12-26 06:53:30 4
3 6:30 2015-12-27 06:29:58 3
4 6:50 2015-12-28 05:52:32 1
5 7:10 2015-12-29 07:09:24 5
判斷式的判斷條件:
data1是預計發車時間,data2是實際發車時間,
比對方式:找實際發車時間與預計發車時間差距最小者(發車前後5分鐘都認定為該Bus_No.)
Bus_No.的判定結果目前是打算用dpylr加在data2的Departure欄位後面,
最後結果輸出為data3(內含 DepartureTime 和 Bus_No. 兩個欄位)
碰到的問題:
1.卡在不同資料集的欄位資料比對
2.data1的Departure欄位 和 data2的Departure欄位 時間格式不一樣,不知怎麼寫判斷式
以上問題還要再麻煩各位大大解惑了@@
[程式範例]:
data3 <- data2[.(這邊應該是寫時間判斷的東西,但我想不出怎麼寫), ] %>%
.[.(DepartureTime, Bus_No.)]
[環境敘述]:
請提供 sessionInfo() 的輸出結果,
裡面含有所有你使用的作業系統、R 的版本和套件版本資訊,
讓版友更容易找出錯誤
[關鍵字]:
dplyr

Links booklink

Contact Us: admin [ a t ] ucptt.com