Re: [新聞] 跳過 CUDA,Deepseek 用精細的 PTX 寫成

作者: a1e (我上了賊船了囧)   2025-01-30 17:43:58
cuda架構長這樣
https://i.imgur.com/Enp8heX.jpeg
一般人都是用上層土黃色那部份的cuda api來寫ai程式
PTX就下層driver那部份,基本上還是奠基在NV的GPU上
PTX的操作方法,NV自己都有手冊了
https://docs.nvidia.com/cuda/parallel-thread-execution/
PTX還是nv提供的api,只是進行更底層的硬體操作,速度一定會比透過cuda上層api快
但會很難寫(看手冊就知道)

Links booklink

Contact Us: admin [ a t ] ucptt.com