[問題] 文字探勘的stopwords

作者: shihs (shih)   2015-07-02 17:01:02
[問題類型]:
程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
[軟體熟悉度]:
入門(寫過其他程式,只是對語法不熟悉)
[問題敘述]:
我想要用R做text mining,但在stopwords這個步驟的時候出錯
Error in UseMethod("tm_map", x) :
no applicable method for 'tm_map' applied to an object of class "list"
[程式範例]:
#讀進一個檔案
data = readLines("test/test.txt")
#進行中文斷詞
insertWords(toTrad(iconv(c("民進黨"), "big5", "UTF-8"), rev=TRUE))#增加詞彙
segment.options(isNameRecognition = TRUE)#增加人名辨識
#將文章分詞
data.seg = segmentCN(data, nature=FALSE)
#stop words
myStopWords = toTrad(stopwordsCN())
data.seg= tm_map(data.seg, removeWords, myStopWords) #清除停用字符
作者: Edster (Edster)   2015-07-02 19:05:00
這是哪個library, 還有你知道R中的list和字串character的差異應該就能了解那段英文的意思。
作者: penolove (醜獸的女朋友)   2015-07-03 02:24:00
unlist 應該就能解了
作者: shihs (shih)   2015-07-08 14:30:00
是tm這個libraryunlist還是無法...錯誤變成是"character"

Links booklink

Contact Us: admin [ a t ] ucptt.com