這串一堆外行
首先 DeepSeek模型特點是
1. 訓練成本低
2. 推理成本低
先說訓練成本低
論文中說的訓練成本低 是用最後訓練出這個模型所花的GPU小時乘上費用小時得到的
實際有實作經驗的人就知道你要嘗試一個新訓練方式 甚至要提高訓練效率 都嘛還要做一
堆實驗 實際上花的成本遠高於此
DeepSeek真正佛心的地方是把他最後訓練所用的方法都寫在論文上了 後人可以少走彎路
但從現在AI進展的速度 這個訓練配方肯定也不是會被一直使用的東西 技術就是這樣一直
進步
結果被一堆媒體用政治的語言解釋 作者本人肯定也莫名奇妙
然後再說上述的“佛心” 也就是發表了論文 這幾年AI進步上一堆突破都嘛有發明論文
美國 歐洲都有 中國的論文也沒少過 怎麼今天突然被highlight 笑死
有問題的是那個天殺的OpenAI 就他都不發論文也不開源
而且前述模型訓練指的是DeepSeek V3 這次能力真的讓AI界驚艷的是Deepseek R2 也就是
基於前述V3模型做後訓練 真正有創造性的是這個 因為OpenAI幾個月前丟出來的o2模型沒
有論文
作者:
poz93 (jaien)
2025-02-01 18:43:00拿來翻譯色遊夠用就算強
作者: shikop 2025-02-01 18:43:00
openAI就是來圈錢的
原本歐噴AI 的用處還真的是用來圈錢,結果來不及圈就破功美國的科研是很燒錢的,上市的時候圈錢才能繼續走下去
作者:
guogu 2025-02-01 18:47:00看b站跟這邊一堆人把訓練跟使用混在一起問是不是以後不用老黃顯卡了 是不是可以每台電腦都裝單機遊戲是不是每個npc都可以用AI那完全就是兩碼子事==
作者: shikop 2025-02-01 18:47:00
openAI我覺得還是有優勢啦 但DS出來就是多一個方法幫大家省成本
我實在很好奇有些人看到"開源" 他想到的開源到底是啥
作者: shikop 2025-02-01 18:49:00
生命自然會找到出路 越打壓越是如此
作者: ruby080808 (zzz5583) 2025-02-01 18:50:00
這塊大部分的人都會開源吧,除了openai ==
沒有一定 你有自信自己搞也進步飛快 沒有一定要開源沒開源的還是遠多於開源的
作者:
ko27tye (好滋好滋)
2025-02-01 18:52:00開源又怎樣 還不是有機會藏木馬!
當然先撇開開發國是哪國不講 如果他願意把自己成果開源確實很佛 但如果他的被確認是盜用別人東西是另一回事
作者:
Ipluck (luckycoffe)
2025-02-01 18:56:00openai自己在網上無視版權亂抓資料訓練模型結果ds出來開源後還在那嘴人家抄他們真的很好笑
作者:
poz93 (jaien)
2025-02-01 18:57:00這杯水乳滑的梗圖 都可以改成這杯水有木馬竊取你資料
我是覺得原碼公開這麼久沒被抓到奇怪的東西應該不至於
作者:
qscgg (QSC)
2025-02-01 18:59:00r1有開源嗎?我以為只有v3
作者: knml (法師) 2025-02-01 18:59:00
openai要正名closeai才對,看不到哪裡open
很多開源軟體和套件都有過因為人為/非人為bug搞出過資漏洞啦 不是開源就一定萬無一失
有能力下開源來驗證的幾乎都能抓出有沒有藏木馬好嗎 說話之前先思考一下很難?
阿人家程式碼擺在那邊,有漏洞你抓出來啊,肚子都剖開了有幾碗粉不會自己看嗎?
作者: ghostxx (aka0978) 2025-02-01 19:04:00
不把所有事扯在一起講要怎麼抹屎
作者:
nbook (書)
2025-02-01 19:07:00偷openai資料 要不要想一下這些資料哪來的 openai現在還不open了笑死
作者:
lanjack (傳說中的草食熊)
2025-02-01 19:11:00現在就是偷了被抓到了啊,至於訴訟我看起來像是openai嗎
人家歐噴AI 就不開放資料你是要去哪裡偷如果真的能偷到,那是不是反向證明了科技大國的美國資安
作者:
lanjack (傳說中的草食熊)
2025-02-01 19:14:00所以我說我看起來像是openai嗎?人家查出是怎麼偷的也沒講,我會通靈是吧?
還有保密文件跟紙糊的一樣,對岸民間的隨便公司都能偷到
作者:
ZMTL (夜風/瀟湘 VR板已經開板!)
2025-02-01 19:15:00其實OpenAI研發副總也在推特上稱讚DS的模型蒸餾,所以OpenAI「指責」DS偷我蠻好奇出自哪裡的然後如果模型蒸餾侵權能被搞成,OpenAI比較需要擔心他們被美國一堆出版社告偷資料訓練模型會不會成
之前說侵權的那篇文就說了目前沒證據啊,後續吵都多餘的
作者:
haha98 (口合口合九十八)
2025-02-01 19:28:00這版有論文的根本沒幾個 跟他們講也是浪費時間 擬人真好
作者:
hcastray (H.C.Astray)
2025-02-01 19:30:00我純看戲 不站隊 因為我完全不懂 不過看起來挺有意思的
作者:
gm3252 (阿綸)
2025-02-01 19:35:00推
一般人就看AI未來發展怎樣又不用站隊急著站隊就那種整天在意識形態的
很多人連蒸餾都搞不清楚 deepseek被太多外行關注了
作者: uohZemllac (甘草精華雄沒醉) 2025-02-01 19:44:00
推
比當初講解大谷合約還痛苦= = 無限跳針+根本看不懂英文的一堆
作者: lovevul3s06 (SaberCat) 2025-02-01 20:06:00
gpt訓練時的東西全部都有經過同意嗎 還是未經別人同意拿來用
作者: busman214 (busman214) 2025-02-01 20:06:00
連中文起訴書都不想看的人怎麼會看英文論文XD
8964占占占 deepseek快抓網路文章訓練喔