PTT
Submit
Submit
選擇語言
正體中文
简体中文
PTT
Python
[問題] 有關語意分析的方向
作者:
RayShigeno
(RayShigeno)
2015-11-11 19:16:07
不好意思我目前想學習有關語意分析這塊
那我做了些功課後發現,使用python是最簡單的
我想問各位,我對語意分析的用法是不是有錯
我想實用在抓取關鍵字
例如去某個網站,利用Python先斷詞,再把出現的次數最高的依序抓出來,這樣就能知道
哪個關鍵字最熱門,進一步做推論
請問我這樣的想法有錯嗎?python可以做到這樣嗎?感謝各位
作者:
ccwang002
(亮)
2015-11-11 19:18:00
Python 可以做到。想法也正確。不過實際上複雜很多例如你覺得 Python 這個版斷完詞之後哪些詞最熱門?不意外會有 Python,但我想「問題」「錯誤」也會很熱門更 general 一點,中文高詞頻有你、大家,商品有漂亮
作者:
bibo9901
(function(){})()
2015-11-11 19:20:00
想法很OK 但是細節很多
作者:
ccwang002
(亮)
2015-11-11 19:21:00
這些詞次數高,但會是關鍵字嗎?就要進一步要思考
作者:
flarehunter
(Range)
2015-11-11 21:39:00
樓上說的是TF-IDF吧
作者:
ccwang002
(亮)
2015-11-11 21:48:00
恩恩,還有 LDA HDP 甚至用 word2vec 做 clustering
作者:
sa0124
((恩恩))
2015-11-12 09:40:00
推薦你可以用jieba斷詞 語意分析好多東西可以玩耶 從你的敘述可以先做TF-Idf
作者: aa000017 (Ophidian_Wang)
2015-11-20 17:27:00
sk-learn和gensim這兩個套件可以拿來用,之前用來做過topic modeling和clusteringscikit-learn,剛才打到簡稱=x=
作者:
new122851
(未若柳絮因風起)
2015-12-05 01:58:00
這牽涉到超多..我現在在搞text SVM classification
繼續閱讀
[問題] touchscreen設定路徑
p147525963
[問題] vpython 3D畫圖
tsungjen
[問題] 畫excel的pivot chart
cmlung
[問題] 有沒有類似jgroups的channel framework?
Killercat
[問題] 如何將配對過後的值刪除
gagalala
Re: [問題] 刪除大量數據的速度問題
uranusjr
[問題] 刪除大量數據的速度問題
stba5328
Re: [問題] pygame error
p147525963
[問題] 關於 python 架構
herbacin
Re: [問題] pygame error
Neisseria
Links
booklink
Contact Us: admin [ a t ] ucptt.com