Re: [問卦] 有沒有文本分析的八卦?

作者: emptie ([ ])   2014-09-17 03:15:44
※ 引述《StubbornLin (鍵盤創業家)》之銘言:
恕刪
: 有沒有語意分析的八卦阿? 想聽聽 NLP (Nature Language Processing)
: 的專家有什麼樣的看法,用程式下去對八卦版的文章做分析應該會有很有趣的結果
其實這個我之前就寫過了(想看的自己a我,不過這篇不是照著打的…有點出入是正常)
只是文章沒什麼人回應然後一下子就沉了…
我想說的就是PTT的設計太差
1. 文章數上限問題
我知道資源不是無限的,但是ptt跟其他論壇比起來
能找到2年前文章的機率趨近於0
PTT的八卦板,就是台灣人對任何事件的健忘之縮影
八卦板人多的時候一周可以回收掉大概10000篇文章
連data都沒有是要怎麼文本分析
2. 沒有好的跨板討論功能
Ctrl+X 不是很好的解決方案,
那叫做在兩邊發一樣的東西
常有人問為什麼八卦板現在一堆無關八卦的文章
就只是因為沒有更適合的地方可以去而已
3. 搜尋功能很爛
完全不能搜尋內文
為了[=]閱讀方便
大家回文時會 Re: 原標題
但是這樣造成文章的識別度很低,
標題完全沒有意義
有意義的內文卻不能搜尋
4. 推文系統超級爛
推出去之後就變成作者的私產,
想刪除就刪除修改就修改
完全沒有主體性
只有文章原作者擁有媒體權力
能推的文字數量太少
要在推文進行討論根本是自虐
至少做到像是這樣再說吧
不要只依照時間順序排序,這根本對閱讀沒有幫助
像是這樣的樹形圖+高亮表示
NetizenA : 今天晚上的八卦板不平靜
NetizenB : @NetizenA 對呀
NetizenC : @NetizenB 連勝文開分身,吱吱崩潰XDDDDDDDDD
NetizenD : @NetizenB 吱吱崩潰XDDDDDDDDD
NetizenE : @NetizenB 吱吱崩潰XDDDDDDDDD
Xeonlian : 嗆我嗆夠了沒?
以上純屬範例,無關任何政黨與個人。
1.3.4.這三點導致黨工很好養,很難抓
2.是間接造成1.的原因
如果依照大家有事情去專版的話
以現在專版的數量如此龐大,
文章不會被碎紙機回收那麼多,那麼快
但是就是因為有些話題很難界定
一個General-discussion板是大家心中的渴望
這點是不會消失的。
我知道ptt一開始設計的初衷或許不是為了進行嚴肅的討論設計的
也知道ptt一開始沒有像現在這麼多人用
我也知道ptt是個人治的地方,人非完美,制度總會出錯……
但如果想要杜絕外力的干擾創造優質的討論空間
是該做點改變了。
作者: donotpush ( )   2014-09-17 03:30:00
好像很專業 推一下
作者: alog (A肉哥)   2014-09-17 03:34:00
用ruby or python走ssh bbsu@ptt.cc就可以做機器人有些潮潮工程師會用nodejs寫robot不然你可以把你懷疑是黨工的人通通加入好友就可以固定掃ip或學我做一個robot掃整個線上的user定期記錄ip位置方法人想的 其實沒這麼困難而且連中國網站都在封存八卦版的文章了你就做一個middleware解就好
作者: noneed2argue (ha)   2014-09-17 04:22:00
確實呢幫認真原PO推
作者: shevchenco (冬肥)   2014-09-17 05:59:00
其實沒看懂,但是好像有道理

Links booklink

Contact Us: admin [ a t ] ucptt.com