→ windowsill: 不 我是要知道認真的
認真的
1.他很便宜,他在晶片禁令下,用比較少的硬體去做出來,而且能力堪比美國一流AI
除了中共禁字不能提之外,他就是一流AI,美國企業砸了比他更多錢,卻不見得比他好
2.他怎麼做到的?
有兩個關鍵技術
- 用很多小模型去串成大模型,所以每次運算時只需要動用一部分小模型,所以對算力
要求不高。但這個技術大廠也會,而且大廠也有在用,只是DeepSeek在這方面的演算法
寫得更優秀,反正中國就是硬體有限,他們只能在其他方面加強來達到效果
- 更關鍵的是,DeepSeek使用了一個叫「Reinforcement Learning」直翻叫強化學習,
他的原理是讓AI自由學習,而在AI學習過程中不告訴它對錯,這會讓AI爆速成長,很快
就能訓練出一個模型,但很明顯這方法有風險,因為AI很有可能學習到要怎麼毀滅人類
,但DeepSeek一樣靠著演算法中避免AI演變成負面結果。結果就是花較少的資源和較少
的時間就訓練出一個很強的AI。這邊用一句話描述就是中國「藝高人膽大」
「Reinforcement Learning」這個技術大廠也會,但他們不太採用,因為就是有風險,
但現在DeepSeek示範了這是可行的,之後大廠應該也會在實驗之後也開始使用。
以上可能有一堆錯誤因為我不是專家 但基本的方向我敢說是沒錯的