Re: [問卦] deepseek超低成本計算是真的嗎?

作者: sharkpops (T-Rex)   2025-01-27 15:03:17
論文有公布
現在就看各家機構要不要去做重複性的驗證
然後使用MOE的稀疏模型,成本一定很低 這無庸置疑
在專業領域一定表現的會比較好,
(單一任務:寫程式、問數學等等)
但泛用型的就可能沒麼理想,
或許最後會發展出泛用型與專業型兩種。
不過也有新創的地方,例如他是訓練是靠自我學習自我解決問題,
這點蠻厲害的。
先不用去糾結有沒有言論審查,這肯定有,
我之前傳一些股票的券商報告,
都被用違反政策給阻止了。 這是比較可惜的。
5萬張H100的事情 目前只是傳聞
幻方絕對不敢講
而且這五萬張放在哪裡也令人覺得有趣
畢竟之前美國的管制禁令把新加坡列為Tier2
而新加坡竟然沒有唉唉叫...
感覺有貓膩啊
※ 引述《koei5566 (光榮56)》之銘言:
: deepseek賣點就是不堆算力
: 改進算法用少量算力做出很大的成果
: 不過有人說是唬爛的
: 財經網美說deepseek偷偷用了五萬顆H100
: 光這成本就幾千萬美金了
: 又偷偷用了中東那邊的算力
: 不可能像deepseek說的那樣只用了550萬鎂就開發出來
: 但是deepseek又開源支持本地運算
: 有張8GB顯卡
: 把deepseek環境架一架
: 斷網跑一下就知道算法是真是假
: 那請問哪邊的說法是真的?
: 有沒有八卦??
作者: kitune (狐)   2025-10-12 16:26:00
好胃口
作者: cake10414 (Peter)   2025-10-12 16:26:00
肥宅表示:
作者: all0pha765 (765)   2025-10-12 16:27:00
難怪三樓那麼痴肥 因為沒做愛幹你老師

Links booklink

Contact Us: admin [ a t ] ucptt.com