Re: [問題] Bag of words 中文單字詞問題 ctr1 PTT批踢踢實業坊

Re: [問題] Bag of words 中文單字詞問題

作者: ctr1 (【積π】) 2018-06-27 08:42:43

我自己來回答
預設過濾掉一個字符長度的詞
text = ["我|，|愛你|白Z",
"他|愛狗",
"貓|愛鼠"
]
vectorizer = CountVectorizer(min_df=1, token_pattern='(?u)\\b\\w+\\b')
vectorizer.fit(text)
vector = vectorizer.transform(text)
print (vectorizer.vocabulary_)
print (vector.shape)
print (vector.toarray())

作者: b24333666 (比飛笨) 2018-06-27 08:55:00

你怎麼把上一篇的推文修掉了....

作者: ctr1 (【積π】) 2018-06-27 08:59:00

兄弟你留言在另一個版~

作者: b24333666 (比飛笨) 2018-06-27 10:45:00

不好意思XDD

繼續閱讀

[問題] Python學習影像辨識切割技巧qwer8716911 [問題] python 如何使用繼承wang19980531 Re: [問題] for loop 的 index 存取問題rexyeah Re: [問題] for loop 的 index 存取問題jlhc [問題] for loop 的 index 存取問題henry8168 [問題] generator / filter疑問tmdggyygan [問題] 字典裡面的內容如何讀入函數中？eco100 [問題] Bag of words 中文單字詞問題ctr1 [問題] 有關用pip 安裝openpyxe的問題pigers [問題] 如何使用python寫line bot機器人？wang19980531