[討論] DeepSeek消息的三大誤區

作者: z1976 (z1976)   2025-02-03 00:05:26
本來標題想寫謠言的,但有些部份可能只是基於對技術名詞不熟悉產生的誤解,我姑且不
假設發佈源頭是有意為之
誤區1:DeepSeek和微軟、NVIDIA、HuggingFace等公司合作
DeepSeek是MIT Licence的開源軟體,簡單說就是可以修改及商用的,它所謂的開源包含
訓練程式碼和權重,那些雲端服務公司拿開源的DeepSeek上架到他們的服務平台,使用者
可以將DeepSeek部署到自己的應用中,這樣算不算一種「合作」,我覺得2:8吧,但我問
了Copilot它是說不算啦
https://i.imgur.com/hz2gtdN.jpeg
同樣問題我拿去問DS-r1,它直接說沒合作,但由於DS現在不能聯網搜索最新資訊所以就
不參考它的答案
不過這些公司在發佈時都有稱讚DeepSeek的「優秀」,這不容否認
誤區2. DS用PTX語言開發可以繞過CUDA
其實任何演算法本來就可以不用cuda,那為何要讓「繞過CUDA」聽起來像一種魔法?我就
不說了
DeepSeek 透過 PTX 語言直接呼叫 GPU 硬體資源,是基於直接實現工程師的想法而跳過
編譯器的決策,但這並不代表沒有用到CUDA硬體。相反地,你寫越多PTX代碼反而越依賴
於輝達的硬體而增加移植的難度
誤區3. 高階晶片將無用武之地
無論是在DS出現之前還是之後,高階和低階 GPU 都能執行 AI 運算,但差異在於運算速
度和效率。
DS的出現或許一定程度的削弱了AI先驅者(OpenAI等) 的壟斷地位,但不能保證未來各公
司還是會繼續在硬體資源上競逐,畢竟預算充足下誰不想要更快?
另外以前就有一些分析以「租用」的角度來比較,高階GPU不僅更快達成目標,還省下以
時間計費的租金成本。

Links booklink

Contact Us: admin [ a t ] ucptt.com