我也來問問,
readxl::read_excel 讀入日期/時間的精準度的問題
偶而還是會遇到讀取Excel的情形
在Windows下,讀MS Excel創造出來的 YYYY-mm-dd HH:MM:SS 這種格式
例:讀取內容
2009-01-03 07:00:00
col_type
1. date: 2009-01-03 06:59:59
2. text: 39997.291666666664
3. numeric: 39997.29
用text屬性差距很少, 但也不是7點整, 因為7/24不能整除.
7/24 = 0.291666666667
(0.291666666664)*24 = 6.999999999936
不知是微軟的問題還是誰的問題.
(Excel好像存到小數點十位(且是用截斷的方式), 但用readxl讀進來卻是12位)
因為我處理的資料都是整點, 也就偷懶這樣處理了.
這支function還有別的用途, 才寫成這樣. 在這邊功能是一樣的就直接貼上來了.
TS是 POSIX 格式: redaxl::read_excel(file, col_type="date")
TS2Oclock <- function (TS) {
MM = as.numeric(format(TS, "%M"))/60; MM[MM>=0.5] <- 1; MM[MM<0.5] <- 0
HH = as.numeric(format(TS, "%H")) + MM
TS = as.POSIXct(paste(format(TS, "%Y-%m-%d")," ", HH, ":00",sep=""))
}
TS2Oclock(as.POSIXct(2009-01-03 06:59:59))
各位用哪支function去重新處理?
我知道用 csv 且用ISOdatetime格式儲存就沒有這種問題, 但總會遇到excel
※ 引述《clansoda (小笨)》之銘言:
: 各位好,我有個xls檔案,他是用general格式去儲存時間格式
: 所以外部顯示會長得像2016/06/21 11:39:25 AM 這樣
: 但其實裡面是用電腦化的紀錄時間會變成42535.49413
: 這個應該是以1990-01-01為止到現在的天數 所以是
: 42535.49413天從那天算起,我用readxl的read_excel讀入
: 但是他的function在讀入的時候只會讀入兩個小數點
: 因此會變成42535.49天,接著我用openxlsx的convertDateTime
: 將這個數字轉換成我們和R看得懂的格式,結果雖然前面都一樣
: 但是差三位小數導致真實的時間差了五分鐘,如果我想將這個數字導正
: 請問除了直接在excel加工之外還有其他的方法嗎,openxlsx的read.xlsx
: 我已經試過了,但是他一直顯示亂碼,我不確定是不是中文太多導致
: 他沒有可以encoding的選項,而xlsx的read.xlsx是太慢無法使用
: 如果要人工去調整excel會很辛苦,因為數量不小
: 不知道有沒有人知道如何解決這個問題呢?