[新聞] 繞開輝達護城河 陸媒傳DeepSeek可改適配

作者: JQK2   2025-02-03 08:26:50
繞開輝達護城河 陸媒傳DeepSeek可改適配中國國產GPU晶片
22:352025/02/02
中時新聞網 盧伯華
據外媒報導,深度求索(DeepSeek)在研發大模型時繞過了輝達的軟硬體整合技術「統一計
算架構」(CUDA)這道AI技術護城河,這種用新的演算法高效利用硬體層面加速,能提高模
型效果。只要有足夠擅長寫PTX語言的內部開發者,就能讓大陸開發的AI模型更容易適配
中國國產GPU晶片,這讓美國不少AI巨頭們感受到極大的威脅。
據《快科技》報導,DeepSeek真的繞過了輝達的計算架構CUDA,北京航空航太大學黃雷副
教授接受採訪時表示,繞過CUDA意味著DeepSeek可以直接根據GPU的驅動函數做一些新的開
發,從而實現更加細細微性的操作。
黃雷指出,譬如DeepSeek在多節點通信時繞過了CUDA,直接使用並行線程執行代碼(
Parallel Thread Excution, PTX),其最多只能實現以演算法的方式來高效利用硬體層
面的加速。一旦速度變得更快,這就意味著別人的模型要訓練10天,而DeepSeek只需要訓
練5天,那麼就能給模型喂更多的資料,即能讓模型在同等時間內看到更多的資料,間接
提高模型的效果。
因此,透過PTX雖然可以進行更多專門的最佳化調整,但缺點是很難維持穩定,需要人力
大量除錯,因此也顯示出 Deepseek 工程師的設計功力。
報導說,Deepseek 的出現,打破了矽谷巨頭在人工智慧競爭中的軍備競賽局面,AI 開發
或許不一定非要追求最強晶片和龐大晶片數量,透過精細的程式設計也能讓低規設備跑出
高效結果,這可能也是前日美國科技股市震盪的主要原因。
報導引述消息人士指出,DeepSeek擁有一些擅長寫PTX語言的內部開發者,假如它之後使
用中國國產GPU,其在硬體適配方面將會更得心應手,其只要瞭解這些硬體驅動提供的一
些基本函數介面,就可以仿照輝達GPU硬體的程式設計介面去寫相關的代碼,從而讓自家
大模型更加容易適配國產硬體。
https://reurl.cc/74NOd9
之前就在想晶片被制裁逼使自己搞,那Ai繪圖晶片GPU不也能自產?靠自己最實在!
作者: fbiciamib123 (Lin)   2025-02-03 08:31:00
中國牛逼
作者: sunpedro0202 (Pedro)   2025-02-03 08:43:00
專門在nv上左佳化,怎麼可能繞過nv
作者: redbeanbread (尋找)   2025-02-03 08:59:00
西台灣不缺電也不缺土地
作者: enjoythegame (~書讀不完了#o#~)   2025-02-03 09:17:00
想太多
作者: jackliao1990 (jack)   2025-02-03 10:02:00
PTX也是輝達的東西 哪有"繞過"去??DEEPSEEK還是只能用輝達的架構和生態系況且改PTX是針對特定型號GPU做優化換到其他GPU會跑不了 超不划算

Links booklink

Contact Us: admin [ a t ] ucptt.com