Re: [新聞] 聯發科AI平台MediaTek DaVinci「達哥」 aPplAus PTT批踢踢實業坊

Re: [新聞] 聯發科AI平台MediaTek DaVinci「達哥」

作者: aPplAus (燦爛) 2024-04-10 20:38:57

原文恕刪
小弟剛好最近有跟到一些台灣LLM的發展，可以補充一下關於模型的部分。聯發科的研究
單位聯發創新基地，做語言模型有一段時間了，之前有一版Breeze-7B模型，發佈了一篇
技術論文放在arxiv：
https://arxiv.org/pdf/2403.02712.pdf
論文提到這個模型是從mistral-7B 繼續訓練而成，花了7000小時的H100，灌了650GB的da
ta。如果有一半是中文，325GB，也灌了超過1000億漢字（3bytes=1word)，其實很多了啦
。
然後Breexe是從Mixtral訓練而成，是更大一級的模型，論文好像還沒出，但很多公司都
有不同大小的模型，做法應該不會差太多（？）。最近有開放API試用：
https://huggingface.co/MediaTek-Research/Breexe-8x7B-Instruct-v0_1
跟ChatGPT的比較，最重要的點應該是，像Breeze-7B這種已經開源的模型，對能架伺服器
的公司來說，是用越多越賺；跟token收費的ChatGPT 用越多越貴截然不同。Breexe不知
道會不會開源就是了。
達哥的部分，沒有親自用過，但有認識的人用過。基本上就是平台，然後有一些功能，像
是讀pdf等等。就把AI推廣給更多人的東西，應該是不錯啦。

作者: turndown4wat (wat) 2024-04-10 21:08:00

這樣發哥明天是漲還是跌?

繼續閱讀

[請益] 今年金融股不可能再出事了吧？humbler [情報] 美國3月份CPIxephon [新聞] 一年內2次疑食物中毒藏壽司新莊宏匯店addy7533967 [情報] 2363 矽統3月自結 -0.03DrowningPool [新聞] 3月出口418.2億美元年增18.9%表現優於預yipi1357 [新聞] 換人坐！國泰金超車富邦金拿下金控獲利三kellindil Re: [心得] 真有永遠的多頭分析師耶!!!!geniustu Re: [心得] 真有永遠的多頭分析師耶!!!!midas82539 [情報] 2488漢平 2024/03營收 Y+72.85% M+42.43addy7533967 [情報] 3052夆典113年3月營收qw5980162