作者:
a1e (我上了賊船了囧)
2025-01-30 17:43:58cuda架構長這樣
https://i.imgur.com/Enp8heX.jpeg
一般人都是用上層土黃色那部份的cuda api來寫ai程式
PTX就下層driver那部份,基本上還是奠基在NV的GPU上
PTX的操作方法,NV自己都有手冊了
https://docs.nvidia.com/cuda/parallel-thread-execution/
PTX還是nv提供的api,只是進行更底層的硬體操作,速度一定會比透過cuda上層api快
但會很難寫(看手冊就知道)