Re: [新聞] DeepSeek R1來了，追平o1！它現在不 ohlong PTT批踢踢實業坊

Re: [新聞] DeepSeek R1來了，追平o1！它現在不

作者: ohlong (強森) 2025-01-27 20:36:44

https://reurl.cc/Q5gWM2
這篇有幫大家看過paper了
基本上就是在chain of thought inference 推理的時候
reinforcement跟supervised比例的嘗試
數理問題RL比重高點
需要文法的文字問題supervised比重多一點
感覺是training手法的不同
跟model的運算架構沒啥關係
我是覺得有點過譽辣
RL天馬行空不見得效率會一直比較好
最後還是得靠堆算力
但是deepseek的成功背後代表的事是
人類的思考框架永遠比想像中的蠢=_=
找一個蠢蛋去supervised 只會得到一個蠢蛋
※ 引述《kobebrian》之銘言
: 先說我完全不懂DS的算法也不懂open ai的算法
: 但既然DS開源那大家都能使用的情況下未來AI迭代肯定加速
: 有人說我用1/50的算法就可以做到一樣的功能...是啊大家都可以用這套算法的情況下那
: 還是得拼硬體
: 我用更強大的硬體可以推出更好的產品、服務除非今天硬體本身的上限到了沒辦法再有
: 更好的硬體來加速運算
: 不然這些大公司要怎麼贏過有同樣效率、算法的對手？我硬體先用到頂規再來用軟體拼
: 贏還是有人覺得這些大公司挖金礦敢用次級鏟子？
: 就是那些小公司現在也「可能」有本錢下來市場玩他們可能可以用次一等的鏟子來挖推
: 出沒那麼好但便宜的產品這會讓整個硬體的市場擴大以前只能是最頂規的硬體跟AI有關
: 現在不是
: 而且也就是「可能」而已
:

繼續閱讀

Re: [新聞] DeepSeek R1來了，追平o1！它現在不但比OpenAI開放，也icrose Re: [新聞] DeepSeek R1來了，追平o1！它現在不但比OpenAI開放，也kobebrian [心得] 大型耗能玩具superteacher [請益] 其實DeepSeek用了幾顆GPU根本不重要teddy98 Re: [新聞] DeepSeek R1來了，追平o1！它現在不但比OpenAI開放，也freeclouds [新聞] 【內房困局】萬科主席及CEO請辭,深鐵董꠭baddaddy [新聞] 川普表示寧可不以關稅對付中國大陸強調scitamehtam [標的] 鴻海台積電 AI泡沫一場空TroyeSivan Re: [新聞] DeepSeek傳偷用5萬顆輝達H100晶片ggian123 [請益] 富台期貨指數換算台指期點數cchysw3021