[問題類型]:
程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
問題很多不好意思麻煩大家了,自己有稍微google過,但總理不出頭緒
[軟體熟悉度]:
入門(寫過其他程式,只是對語法不熟悉)
[問題敘述]:
我想要import/read csv or xlsx file,但我不清楚R的概念。
1. 如我的資料在 D:\destop\datatest.csv,我的R Script也需要放在 D:/destop/ 嘛?
2. 有什麼方式可以讓我只要設定一次路徑,將資料擺在同個資料夾方便import?
3. 為什麼常常看到 library(readxl),如果我要使用 read_excel 的 code
如
library(readxl)
C1_data <- read_excel("D:\\destop\\datatest.xlsx")
4. 什麼狀況下 路徑的slide要 \\ 或 / ?
5. 假設我要import/read的資料檔案大小非常大,如下方 1.48 GB 的CSV (最主要的問題)
https://aqsdr1.epa.gov/aqsweb/aqstmp/airdata/hourly_44201_2016.zip 如連結
https://aqsdr1.epa.gov/aqsweb/aqstmp/airdata/annual_all_2016.zip <- 檔案較小供作測試
有沒有什麼方法可以讓我只抓它特定的row and column (包含數字與字串)
如 我想要 import 所有的 data,但在county.name的column裡面只要有"cook","DuPage",
"Kane","Kenosha","Lake","McHenry","Porter","Will"的rows就好。
6. header的字串原本有空白間距,import之後空白變成 .
我之後在處理的時候要 打 . 還是 空白?
[程式範例]:
#