抱歉 原本的數據有錯 已修改
各位前輩好
最近在使用GPGPU-Sim 3.2.2來模擬CUDA程式,想了解block大小對於程式的影響
我挑選模擬器附的Benchmark BFS來改
原本程式中的block數為256,而每個block中有256個thread
而我修改成2048個block,每個block有32個thread
原本預想thread總數相同,模擬結果應該OK,頂多執行速度變慢
但是模擬器吐出的訊息顯示修改後的模擬cycle以及指令數量與原本相差許多
原本:
gpu_tot_sim_cycle = 773568
gpu_tot_sim_insn = 15889228
gpgpu_simulation_time = 0 days, 0 hrs, 4 min, 23 sec (263 sec)
修改後:
gpu_tot_sim_cycle = 697192
gpu_tot_sim_insn = 14920542
gpgpu_simulation_time = 0 days, 0 hrs, 2 min, 47 sec (167 sec)
模擬的數值差了一些 這是有問題的嗎?
而且比對輸出的result也不同
請問問題出在哪? 是因為block數量不同 而blockID影響結果?
我對於block數量與程式的關係還不熟悉
應該怎麼調整block以及thread的數量,而不影響程式結果呢
另外想請教GPGPU-Sim使用上遇到問題有哪裡可以發問嗎
目前只有看到GOOGLE Group,不過似乎不太熱絡?