GPU跟CPU的同步現在都是使用cudaDeviceSynchronizeThreadSynchronize似乎是比較舊的版本
![]()
" target="_blank" rel="nofollow">
![]()
然後kernelB和C會順序執行 除非你是用stream 但CPU依然跑下一個functionstream部分可以參考官方PDF
![]()
" target="_blank" rel="nofollow">
![]()
然後你說的除非3 cudaMemcpy我的理解應該是 你不是用Async的話,應該都是算是cpu的指令最近我也在用CUDA寫程式,不足的地方還請版友補充