[問題] 關聯式規則有空集合

作者: a3236852 (serena)   2018-03-06 11:40:12
[問題類型]:
程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
[軟體熟悉度]:
入門(寫過其他程式,只是對語法不熟悉)
[問題敘述]:
我要用R做關聯式規則,
使用arules套件,分析出來不知道為什麼會有空集合?(不知道怎麼描述XD)
我想可能是我最小信賴度(min confidence)調太低?
想知道為什麼調太低會出現空集合?
還有想知道要怎麼提高分析出來的結果數量,
本來以為是增加資料,但因為原始樣本就只有這些,
所以用隨機的方式增加原本的樣本,
結果不知道是不是因為關聯式規則算法是
在全部東西裡佔幾分之幾,還有在a東西裡b也存在的幾分之幾,
所以整體就跟著增加,並沒有比較多的分析結果
後來把資料刪減到50筆反而比較多
有沒有什麼方法可以將結果增加呢?除了得到更多原始資料,
謝謝~
[程式範例]:
張貼能夠重現錯誤的程式碼,可以幫助版友更快的幫你解決問題
建立重現錯誤的方法可以參考:
install.packages("readxl")
library(readxl)
path <- "random.csv"
data <- read.csv(path, header=T, sep=",")
data1=as.matrix(data)
require(arules)
rule <- apriori(data1,parameter=list( supp=0.1, conf=0.1))
inspect(rule)
https://imgur.com/kH9IvlP
資料大概是長這樣 有49個項目A1~A49
原始資料筆數是大約是五百筆,
結果是這樣
https://imgur.com/PCEz9We
[環境敘述]:
R version 3.4.1
[關鍵字]:
關聯式規則
作者: sw52099 (sw52099)   2018-03-06 21:49:00
Supp太高 我的經驗是6000筆資料都會把supp調到0.003之類的才會有結果你的supp是0.1,資料是500筆,代表同一個規則要出現500*0.1=50次(就是結果裡的count)才會算進來。而500筆資料要出現相同的規則50次,感覺上是有點困難啦,有錯請各位指正。呃...不好意思,圖沒跑出來,看來我回答錯了,請忽略上面一大段(潛水)
作者: clansoda (小笨)   2018-03-06 22:17:00
我的經驗是 不管你門檻怎麼調那個空白的規則都會存在可能要問作者,不過那個package應該是已經沒有再維護了
作者: a78998042a (Benjimine)   2018-03-06 22:23:00
基本上關聯規則是你篩選出給定support, confidence 的結果,只是根據條件可以用apriori 演算法加速篩選,而資料中的每種組合都有一組supp, con,演算法只是選出來給你看,所以如果妳想增加規則的結果,你可以考慮先列出所有的規則組合,再看看你要多少結果,反著切sup跟con。如果有新資料,再用妳上一個切的結果做樣本參數,然後就看你想怎樣做了。
作者: Luluemiko (露露)   2018-03-07 10:28:00
先射箭,再畫靶,去測支持度跟信心度的參數組合

Links booklink

Contact Us: admin [ a t ] ucptt.com