Re: [姆咪] 有ai大師嗎

作者: lou3612 (魚)   2025-01-28 14:07:55
※ 引述《umi0912umi (赤井はあとのぶた)》之銘言:
: 那個deepseek我看有人在說他是RL
: 然後用無監督
: 但我記得transformer不也是無監督嗎
: deepseek有哪邊比較特別嗎
: 然後我覺得這張圖很好笑
: https://i.imgur.com/aka2y5t.jpeg
差很多
一時半刻有點難說清楚
RL比較少人說是無監督 應該說是自動監督?
不論如何都比supervised便宜很多很多
deepseek只用了一點點SFT來穩定模型的行為
然後就全用RL來衝performance
所以就比一般的LLM很要省錢省非常非常多

Links booklink

Contact Us: admin [ a t ] ucptt.com