※ 引述《WinNOKIA (海神)》之銘言:
: 1. DeepSeek創辦人梁文鋒,少年股神變AI大神
: 2. 紐約時報指出,DeepSeek是由中國對沖基金幻方量化(High-Flyer)創辦
: 3. DeepSeek 宣稱,訓練成本僅 557.6 萬美元,幾乎是其他科技巨頭大型語言模型的
十
: 分之一成本,這個費用也差不多是一位 AI 主管的年薪而已。
: 綜合以上媒體報導與揭露來看,DeepSeek是什麼狀況,不就很清楚了嗎?
來看看大神Andrej Karpathy是怎麼評論的
Andrej Karpathy
https://i.imgur.com/WYEHc65.jpeg
首先要打臉的是第二點
DeepSeek告訴大家,他是利用2048片H800 GPU, 經過兩個月的時間,訓練出來的,訓練費
用是550萬鎂
你訓練使用的GPU,可以當成設備成本,給之後的使用來做攤提,一片H80,一個小時租賃
可以到2~3美元/小時
所以用兩個月來計算,確實符合550萬鎂的訓練成本
而幾乎所有AI 模型都是給你訓練成本,這點DeepSeek沒有不同
這也是為什麼Andrej Karpathy會說這是如同「笑話般的預算」 因為他是其他模型訓練的
1/10~1/20的價格
對照財政部某官員在某財經網美下面被噴到刪留言的事情~嗯 我只能說有這種言論不意
外
https://i.imgur.com/SviWZpc.jpeg
至於你說第一點幻方量化是少年股神變AI大神,因為人家本來就是做大數據的,是用大數
據來炒股財富自由以後才來玩AI,順序不能搞錯