[問題] 有關語意分析的方向

作者: RayShigeno (RayShigeno)   2015-11-11 19:16:07
不好意思我目前想學習有關語意分析這塊
那我做了些功課後發現,使用python是最簡單的
我想問各位,我對語意分析的用法是不是有錯
我想實用在抓取關鍵字
例如去某個網站,利用Python先斷詞,再把出現的次數最高的依序抓出來,這樣就能知道
哪個關鍵字最熱門,進一步做推論
請問我這樣的想法有錯嗎?python可以做到這樣嗎?感謝各位
作者: ccwang002 (亮)   2015-11-11 19:18:00
Python 可以做到。想法也正確。不過實際上複雜很多例如你覺得 Python 這個版斷完詞之後哪些詞最熱門?不意外會有 Python,但我想「問題」「錯誤」也會很熱門更 general 一點,中文高詞頻有你、大家,商品有漂亮
作者: bibo9901 (function(){})()   2015-11-11 19:20:00
想法很OK 但是細節很多
作者: ccwang002 (亮)   2015-11-11 19:21:00
這些詞次數高,但會是關鍵字嗎?就要進一步要思考
作者: flarehunter (Range)   2015-11-11 21:39:00
樓上說的是TF-IDF吧
作者: ccwang002 (亮)   2015-11-11 21:48:00
恩恩,還有 LDA HDP 甚至用 word2vec 做 clustering
作者: sa0124 ((恩恩))   2015-11-12 09:40:00
推薦你可以用jieba斷詞 語意分析好多東西可以玩耶 從你的敘述可以先做TF-Idf
作者: aa000017 (Ophidian_Wang)   2015-11-20 17:27:00
sk-learn和gensim這兩個套件可以拿來用,之前用來做過topic modeling和clusteringscikit-learn,剛才打到簡稱=x=
作者: new122851 (未若柳絮因風起)   2015-12-05 01:58:00
這牽涉到超多..我現在在搞text SVM classification

Links booklink

Contact Us: admin [ a t ] ucptt.com