PTT
Submit
Submit
選擇語言
正體中文
简体中文
PTT
Python
[問題] word2Vec 自然語言處理 中文語料庫
作者:
zero0o0o8279
2017-07-06 14:50:05
最近在研究sentiment analysis
練習了一下如何使用word2vec
可是大多數範例好像都是用英文的
想試試看中文的效果如何,不知道有沒有已處理好的中文語料庫可以使用,
還是都要自己先收資料,做好斷詞等等處理才行呢?
小的剛入門還不太懂,若講到的詞有觀念錯誤或是奇怪的地方還請各位高手多多指教~
作者: hsnuyi (羊咩咩~)
2017-07-06 15:00:00
中研院有詞庫 有人把它抓下來整理好 放在github上 斷詞的話 以前是都用jieba 現在好像有更好的
作者:
BigBank
( )
2017-07-06 15:31:00
用維基百科去處理
作者:
zero0o0o8279
2017-07-06 15:42:00
有找到中研院的可是連結好像都掛了 再去github看看維基的話 不太懂要怎麼處理那個原始檔 可以指點一下方向嗎
作者:
a75468
(GB Lin)
2017-07-06 16:08:00
https://github.com/zake7749/word2vec-tutorial
作者:
minikai
(一肚子拐)
2017-07-06 23:50:00
最近公司也在處理中文斷詞 真的有比Jieba好用的嗎?
作者: hsnuyi (羊咩咩~)
2017-07-08 01:50:00
我是在p2看到的 可是我最愛很多個 一時找不到...
作者:
dppman
(*^o^*)
2017-07-08 19:18:00
可以分享一下GitHub 上整理的中研院的資源嗎?
作者:
bluecadence
(Maxwell's demon)
2017-07-08 20:00:00
我記得中研院的詞庫要收錢了 如果沒記錯的話
作者:
Shane7
(軒柒)
2017-07-14 17:33:00
中文維基百科 再自己斷詞
繼續閱讀
[問題] 命令列數學排版的問題
LessonWang
[問題] python 編碼
gn301046
[問題] 輸出到檔案時數據不完全
dogs1231992
[問題] 請問一個在matplotlib 顯示中文的問題
MrPanda
[問題] CIFAR-10, ImageNet dataset 格式
dppman
[問題] 呼叫C 函式的問題
vgy
[問題] 網頁定位卡關
yimean
[問題]複數 浮點數 有理數的一些問題
LessonWang
[問題] BeautifulSoup select class filter
cocoaswifty
[問題] AttributeError:..has no attribute 'ENTER'
yimean
Links
booklink
Contact Us: admin [ a t ] ucptt.com