PTT
Submit
Submit
選擇語言
正體中文
简体中文
PTT
Python
[問題] 有PTT中文語料庫嗎?
作者:
nesiron
(Nes)
2019-11-28 10:47:47
大家好
小弟最近在學習中文sentiment analysis
目前想對PTT文章的情緒做分類
我找到的中文語料庫大多是中文維基或者新聞的
比較少PTT的情緒分類語料
請問現在有好用的PTT語料庫可以用來training嗎?
謝謝
作者:
penut85420
(PenutGGorz)
2019-11-28 11:54:00
可以試著自己爬看看,PTT Web還蠻好爬的這是小弟以前以谷歌關鍵字為入口的PTT爬蟲,參考看看
https://git.io/JeXMZ
作者:
CodingMan
(程式俠)
2019-11-28 12:01:00
可以用 PTT Library 可以下關鍵字搜尋不用下載你不在意的資料 減少資料清洗時間
https://github.com/Truth0906/PTTLibrary
作者:
DeepLearning
(深度學習)
2019-11-28 13:36:00
推 PTT Library 穩定好用 作者回覆問題很快
作者:
alvinlin
(林矜業)
2019-11-28 17:11:00
https://github.com/zake7749/Gossiping-Chinese-Corpus
作者:
nesiron
(Nes)
2019-11-28 17:21:00
感謝大家XD,我都用看看
繼續閱讀
[問題] pexpect的send()出現Invalid argument錯誤
hcl012
Re: [問題] 某個迴圈遇到錯誤 迴圈想要再次執行
TuCH
[問題] 某個迴圈遇到錯誤 迴圈想要再次執行
loser113
[問題] tkinter label顯示爬蟲結果
ariel777
[問題] opencv播影片 操作特定frame
jot100232
[問題] requests alert
bnn1999
[問題] ping ip 取得延遲時間
ctr1
[問題] 請問使用plt.ion / plt.ioff
nicha115
[問題] 關於keras callback指令失效
oo855050
[問題] 建構datafram出現以下錯誤訊息
filialpiety
Links
booklink
Contact Us: admin [ a t ] ucptt.com