[問題] 從評論提取特徵並做成分類器

作者: nchunerdy120 (batman)   2020-05-08 23:01:48
小弟目前是學生,有個專案是要從幾萬筆的評論中提取出幾個重要的特徵,並且將這些特
徵拿來製造篩選器。
例如從餐廳的評論中得出「食物種類」、「食物價錢」、「食物口味」非常重要,就用這
三個當作分類器的attribute。然後在給定這些attribute值的時候,就能夠導向對應的餐
廳。
自己思考一下作法後,歸類出兩個問題:
首先是該如何提取特徵?我目前的想法是使用tf-idf向量化,找出tf-idf最高的前幾個字
當作曬選器的attribute(X)。請問還有其他更適合的方式嗎?
第二個問題是該如何把餐廳(Y)跟選定的attribute(X)做連結?畢竟無法連結的話就
無法訓練分類器,所以該怎麼把這些attribute(X)跟餐廳(Y)是個大問題... 目前怎
麼解決這件事情小弟完全沒有頭緒,不知道有沒有大神可以解答Orz [編輯]:選定att
ribute之後該怎麼將評論中對應attribute的文字量化,例如評論中提到「食物很好吃」
,那該如何將「好吃」量化放入食物口味的attribute中
麻煩各位鄉民們替小弟解惑,如果有上述方法以外的作法也麻煩各位不吝提出,感謝!
作者: TuCH (謬客)   2020-05-08 23:40:00
第二個問題是?? 評論就能產生X吧
作者: jigfopsda (jigfopsda)   2020-05-08 23:51:00
給Y一個具體的定義,然後看一下 supervised learning看看?
作者: nchunerdy120 (batman)   2020-05-09 00:12:00
y就是餐廳唷,例如「爭鮮」「必勝客」
作者: s860134 (s860134)   2020-05-09 00:16:00
你想要的應該是推薦系統,把評論關鍵字轉換成加權分數根據加權分數算出排名推薦出來吧?關鍵字 -> 分數 想是沒什麼客觀標準拉...
作者: ddavid (謊言接線生)   2020-05-09 00:53:00
講推薦系統很籠統,同樣是推薦系統,其外表的目的性跟內部的實際方法都可能天差地遠你在用的導航系統也是推薦系統(推薦你路線),Google廣告也是推薦系統(嘗試推薦你更可能有興趣的廣告),Facebook推薦你可能認識的好友也是推薦系統,推薦系統其實是一個太大的類別,只講推薦系統其實沒有解答到到實作方向的答案
作者: silverair (木柵福山雅治)   2020-05-09 01:35:00
RNN語意分類?tensorflow官方教學有輸入IMDB評論,然後判斷這個評論是屬於正面或負面
作者: ouryouth (ouryouth)   2020-05-13 19:32:00
大部分的評論都有這三種attributes嗎 沒有的話感覺data很難處理
作者: ddavid (謊言接線生)   2020-05-21 15:21:00
樓上,當然不一定有啊,沒有的你就是要給個missing值之類的來標記

Links booklink

Contact Us: admin [ a t ] ucptt.com