作者:
z1976 (z1976)
2025-02-03 00:05:26本來標題想寫謠言的,但有些部份可能只是基於對技術名詞不熟悉產生的誤解,我姑且不
假設發佈源頭是有意為之
誤區1:DeepSeek和微軟、NVIDIA、HuggingFace等公司合作
DeepSeek是MIT Licence的開源軟體,簡單說就是可以修改及商用的,它所謂的開源包含
訓練程式碼和權重,那些雲端服務公司拿開源的DeepSeek上架到他們的服務平台,使用者
可以將DeepSeek部署到自己的應用中,這樣算不算一種「合作」,我覺得2:8吧,但我問
了Copilot它是說不算啦
https://i.imgur.com/hz2gtdN.jpeg
同樣問題我拿去問DS-r1,它直接說沒合作,但由於DS現在不能聯網搜索最新資訊所以就
不參考它的答案
不過這些公司在發佈時都有稱讚DeepSeek的「優秀」,這不容否認
誤區2. DS用PTX語言開發可以繞過CUDA
其實任何演算法本來就可以不用cuda,那為何要讓「繞過CUDA」聽起來像一種魔法?我就
不說了
DeepSeek 透過 PTX 語言直接呼叫 GPU 硬體資源,是基於直接實現工程師的想法而跳過
編譯器的決策,但這並不代表沒有用到CUDA硬體。相反地,你寫越多PTX代碼反而越依賴
於輝達的硬體而增加移植的難度
誤區3. 高階晶片將無用武之地
無論是在DS出現之前還是之後,高階和低階 GPU 都能執行 AI 運算,但差異在於運算速
度和效率。
DS的出現或許一定程度的削弱了AI先驅者(OpenAI等) 的壟斷地位,但不能保證未來各公
司還是會繼續在硬體資源上競逐,畢竟預算充足下誰不想要更快?
另外以前就有一些分析以「租用」的角度來比較,高階GPU不僅更快達成目標,還省下以
時間計費的租金成本。