首先我有兩個2D矩陣
A: m x 128
B: n x 128
m, n大約10000左右
我其中有一部分運算會使用到
np.subtract(A[i, :], B) 此產生出n x 128的矩陣
而這個運算A的每個row都要做, 也就是做m次
最直觀就是使用for迴圈跑m次
但是因為太慢了所以想起來有個broadcasting可用
直接np.subtract(A, B[:, None])就好, 產生個3D tensor
但問題在於這個居然比for迴圈還要緩慢 而且是顯著慢很多
不知道這種運算有沒有更快速的解法
本來猜可以用vectorize
但是查doc發現"The implementation is essentially a for loop"這句話
所以可能也沒用? 我姑且試寫了一下目前是error 還沒搞熟這個XD
不知道有沒有人知道怎麼樣讓這個過程變快
大絕應該就是直接開multi-process吧 希望有更好的選擇@@
感謝收看