Re: [邊緣] Deepseek屌在哪

作者: TentoEtsu (天藤悅)   2025-01-28 09:37:09
→ windowsill: 不 我是要知道認真的
認真的
1.他很便宜,他在晶片禁令下,用比較少的硬體去做出來,而且能力堪比美國一流AI
除了中共禁字不能提之外,他就是一流AI,美國企業砸了比他更多錢,卻不見得比他好
2.他怎麼做到的?
有兩個關鍵技術
- 用很多小模型去串成大模型,所以每次運算時只需要動用一部分小模型,所以對算力
要求不高。但這個技術大廠也會,而且大廠也有在用,只是DeepSeek在這方面的演算法
寫得更優秀,反正中國就是硬體有限,他們只能在其他方面加強來達到效果
- 更關鍵的是,DeepSeek使用了一個叫「Reinforcement Learning」直翻叫強化學習,
他的原理是讓AI自由學習,而在AI學習過程中不告訴它對錯,這會讓AI爆速成長,很快
就能訓練出一個模型,但很明顯這方法有風險,因為AI很有可能學習到要怎麼毀滅人類
,但DeepSeek一樣靠著演算法中避免AI演變成負面結果。結果就是花較少的資源和較少
的時間就訓練出一個很強的AI。這邊用一句話描述就是中國「藝高人膽大」
「Reinforcement Learning」這個技術大廠也會,但他們不太採用,因為就是有風險,
但現在DeepSeek示範了這是可行的,之後大廠應該也會在實驗之後也開始使用。
以上可能有一堆錯誤因為我不是專家 但基本的方向我敢說是沒錯的
作者: RosieChaeng (我愛彩英)   2025-01-28 09:43:00
所以這用來寫程式有比gpt Claude好用嗎
作者: TentoEtsu (天藤悅)   2025-01-28 09:43:00
目前沒有而且他用途不多,他沒有圖像辨識,也沒有自動駕駛
作者: windowsill (藍冬海)   2025-01-28 09:44:00
感謝解釋
作者: waitan (微糖兒>////<)   2025-01-28 09:45:00
那老黃的晶片還會有人要嗎
作者: kitune (狐)   2025-01-28 09:45:00
最根本的原因還是點出了設備不用堆太多就有點效果
作者: TentoEtsu (天藤悅)   2025-01-28 09:45:00
但在生成式語言這塊很厲害 他學了一堆瞎雞巴的東西
作者: kitune (狐)   2025-01-28 09:46:00
老黃鏟子還是可以賣啊 只是以後大家不會搶購了 正常買
作者: TentoEtsu (天藤悅)   2025-01-28 09:46:00
例如他會模仿ptt酸民發文
作者: Megacolon (外物侵入造成巨結腸症)   2025-01-28 09:47:00
感覺制裁阿共是對的,讓阿共自己練蠱,總會搞出很邪門的東西,牢蔣當年就是讓阿共閉門練出蠱王牢毛
作者: TentoEtsu (天藤悅)   2025-01-28 09:47:00
GPU還是會有很大的需求啊DeepSeek他只是用了比較少的GPU,但實際少到什麼程度如果你看到那種很誇張的數字都是吹出來的你就想如果今天中國可以堆硬體 他們會不會堆 一定也會有誰不想 對ㄚ
作者: Alwen (鳳梨)   2025-01-28 09:54:00
只要大廠停止加碼買鏟子,nv就會崩一大段惹,即使他們還是有在買鏟子
作者: TentoEtsu (天藤悅)   2025-01-28 09:54:00
短空長多 送分題
作者: Alwen (鳳梨)   2025-01-28 09:55:00
要改買軟體類的股啦 ,阿祖昨天就漲給大家看惹
作者: DoraGian (飲冰)   2025-01-28 09:55:00
RL也不是新東西了 他裏面沒有transformer嗎?最耗gpu的部分
作者: TentoEtsu (天藤悅)   2025-01-28 09:56:00
怎麼可能停止加碼 = = 有人真的以為DeepSeek是終點站嗎變形金剛什麼的窩不曉得ㄟ
作者: Alwen (鳳梨)   2025-01-28 09:57:00
就是每年資本支出不再巨大成長惹,我蠻懷疑他們短期兩三年還會不會繼續巨大成長

Links booklink

Contact Us: admin [ a t ] ucptt.com