想請問版友有人算過有趣性(Interestingness)的嗎?
http://msdn.microsoft.com/zh-tw/library/ms175382.aspx
根據裡面的說明,可以找到有趣性的公式為:
Interestingness(Attribute) = - (m - Entropy(Attribute)) *
(m - Entropy(Attribute))
m代表整個功能集的entropy (我不太懂這句的意思)
假設有兩個變數 x=2,2,3,4,5,6
y=3,4,4,4,6,8
根據Shannon entropy H(x)= - sum_i p(x_i) * log_2( p(x_i) )
p(x_i)為X的pmf
X的entropy H(x)=2.251629
Y的entropy H(y)=1.792481
那請問m及x,y的interestingness是多少呢?
那麼Interestingness是越高越好? 還是越低越好?
因為感覺起來會為負數,跟我原本以為是正數不大一樣
先謝謝各位了!!