開發平台(Platform): (Ex: Win10, Linux, ...)
Linux
編譯器(Ex: GCC, clang, VC++...)+目標環境(跟開發平台不同的話需列出)
額外使用到的函數庫(Library Used): (Ex: OpenGL, ...)
問題(Question):
我有個疑問是關於配置cuda block的維度問題
若今天gridsize(2,2),總共block數是4和gridsize(4)一樣也是4
我知道差別是1維與2維,也知道一個SMP只能同時間用1個block(除非block需要等待再
換另一個block)
但我的問題是什麼時間需要用到2維呢?(是矩陣運算嗎?)
還是用2維grid我可以同時分配給不同SMP呢?
謝謝