- 問題: 當你想要問問題時,請使用這個類別
[問題類型]:
程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
[軟體熟悉度]:
請把以下不需要的部份刪除
使用者(已經有用R 做過不少作品)
[問題敘述]:
請簡略描述你所要做的事情,或是這個程式的目的
我想問
一般我到資料都是 長這樣的.csv
txt1 ALICE... 2015/01/02
txt2 asking... 2015/01/04
txt3 people.. 2015/01/13
. . .
. . .
. . .
但是資料很大 一轉秩後 EXCEL 就打不開
txt1 txt2 txt3 . . . .
ALICE.. askainq.... people....XX
2015/01/02 2015/01/04 2015/01/13
做完 text mining 後
主要我拉出關鍵字後,到文章後
ex轉秩後,去比對原文章後,日期那欄無法帶出
ex轉秩後 EXCEL 打得開 日期帶得出
但是如果ex 資料量太大時 轉秩後 打不開
日期那欄就 GG了~~
library(xlsx)
ex<-read.xlsx(file.choose(),2)
ex<-t(ex)
health<-grep("health", f8)
write.csv(ex[health],file="health.csv")
[程式範例]:
f1<-read.csv(file.choose(),sep=",")
f1<-t(f1)
f2 <- Corpus(VectorSource(f1))
#one<- tm_map(one, PlainTextDocument)
f3<- tm_map(f2, removePunctuation)
f4 <- tm_map(f3, removeNumbers)
f5 <- tm_map(f4, tolower)
f6 <- tm_map(f5, removePunctuation)
f7 <- tm_map(f6, removeWords, stopwords("english"))
f8<-tm_map(f7, stemDocument)
library(xlsx)
ex<-read.xlsx(file.choose(),2)
health<-grep("health", f8)
write.csv(ex[health],file="health.csv")
[關鍵字]:
t()
選擇性,也許未來有用