最近在探討一個生成機率模型(LDA)
透過LDA可以產生一個topics-documents矩陣
裡面的entry用條件機率來表示的話為Prob(topic|document)
也就是一個document會有多個topic分佈,每個分佈都有一個機率
想請問的是
如果我想計算topic之間的相似度的話
假設column是表示topic
那可以將每個column分別取出來做內積之後做cos similarity嗎?
請問cos similarity需要在甚麼條件下才會成立(才允許做)?
謝謝各位版友的指教