※ 引述《wvookevp (ushiromiya)》之銘言:
: 忽然想到
: 如果改天
: PTT將強制所有推文無償用於AI訓練
: 最後訓練出來的帳號推文會是什麼模樣?
: 有沒有希洽?
中國有人試過類似的事情了
不過他們拿來訓練的 是一個叫弱智吧的貼吧(討論板)
https://www.youtube.com/watch?v=ghLCJRTAlMA
相關的研究方法後來還被發表成了論文 可以搜尋ruozhiba
總之弱智吧不管初衷為何 後來逐漸演變成一種幽默的笑話板
但前提是你電波能對得上
如果要拿PTT的資料來做訓練 實際上是會有雜訊的
因為PTT的呈現方式 你要能夠辨識出是哪些板友在底下討論
這種前後文的關係梳理 本來就需要繁雜的預處理
弱智吧本身的灌水量不低 所以就算是資料集也是透過指標篩選或人為推薦的
PTT的狀況是 一篇爆文底下可能80%的推文都是一樣的
這樣的訓練資料並沒有太大意義
除非你今天是要訓練專門推噓文的空軍
那針對特定議題或關鍵字直接膝反射推噓 那是沒問題
而且我相信 已經有人在這麼幹了