[問題] 計算多字詞的關聯並視覺化

作者: mikejhou (Mike)   2015-08-17 01:24:47
[問題類型]:
程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
[軟體熟悉度]:
入門(寫過其他程式,只是對語法不熟悉)
[問題敘述]:
現在收集完需要分析的字詞
要建構出字詞與字詞間的關聯性,會以節點與連線的方式呈現。
假設關鍵字中Apple
Apple是節點
連線出去連結到的節點就是與之相關的關鍵字
像是iOS、iPhone、iPad等等
1.想了解有那些Package能夠做到文字關聯性分析的效果
2.那些Package可以把計算完的結果視覺化成節點與連線的樣式
[程式範例]:
自己還沒開始寫
但找到Normalized Google distance法
Normalized Google distance是用google的搜尋當基礎
資料量計算強度後會證明兩字關聯性
若兩者越接近0表示兩字關聯越強的方式計算
但不太知道還有沒有更精確的方法可以做做看
[環境敘述]:
目前抓取的字詞約800多筆
以CSV檔案的形式存取
由於小弟的目標是論文的關鍵字
所以同一篇論文使用的關鍵字會存在同一行
[關鍵字]:
字詞 計算文字關聯 視覺化(節點與連線)
作者: Wush978 (拒看低質媒體)   2015-08-17 20:57:00
也許用word2vec 加上一些高維度資料的視覺化工具

Links booklink

Contact Us: admin [ a t ] ucptt.com