就八七啊
AI直接就是軍武等級的花費
我認識做AI的教授
在chatGPT 出來的時候直接棄做自然語言這塊
直接加入換主題研究
人家chatGPT一次建模 幾億元就噴了
數據庫是數以億計的資料
台版GPT不朝這方面前進用人家的資料庫
還幻想自建
講支語就是因為資料庫是支語啊
誰匯的資料?根本不可能有人十項全能,每種資料都可以辨認誰是支語誰是台灣用語
更有可能的是爬蟲寫一寫
最多限定.tw的資料來源
殊不知那些排名前的也是抄支語網站
老實說不如做個支語轉換器
公開讓各行各業的人標示支語,然後轉掉就好了
核心還是用chatGPT
不然要養自己的模型
一來運算太貴 二來沒有資料庫
最慘的是建出來的模型沒人用