Re: [姆咪] 有ai大師嗎 umi0912umi PTT批踢踢實業坊

Re: [姆咪] 有ai大師嗎

作者: umi0912umi (UMI) 2025-01-28 14:57:30

※ 引述《lou3612 ( )》之銘言：
: 差很多
: 一時半刻有點難說清楚
: RL比較少人說是無監督應該說是自動監督?
: 不論如何都比supervised便宜很多很多
: deepseek只用了一點點SFT來穩定模型的行為
: 然後就全用RL來衝performance
: 所以就比一般的LLM很要省錢省非常非常多
transformer我記得不是靠遮掉某部分然後自己學
是說自動監督跟無監督差在哪
我已經都不懂惹QQ
但我只是好奇RL不是蠻久前的東西
前陣子我看幾乎都是在討論transformer
突然RL又冒出來好神奇
反清復明惹屬於是

作者: HGK (HGK) 2025-01-28 14:59:00

RL百鍊不垂好用

作者: steven183 (steven183183) 2025-01-28 15:03:00

transformer是監督吧我回第一篇ㄉ

作者: umi0912umi (UMI) 2025-01-28 15:05:00

是喔那我搞錯惹QQ

繼續閱讀

[閒聊] 複製文napacabbage [閒聊] 今天晚上要吃好料的yangjam [閒聊] 年復一年alex257984 [BGD ] 過年的台灣：ken1990710 Re: [閒聊] 每日leetcodeRushia [BGD ] 母雞卡最大問題在祥子吧？john0909 Re: [姆咪] 馬自立Gas987 [邊緣] 好無聊唷假日在家裡要做啥?tessamaimai RE: 拜拜qscxz Re: 為什麼默認海鈴都是攻diefish5566