※ 引述《arrenwu (拉姆真可愛)》之銘言:
: ※ 引述《zxcvfr99 (誰も気づかない人)》之銘言:
: : 指令集下面說了就不說,說點軟體的
: : 有做科研的應該都有聽過intel mkl吧?
: : 這東西就是intel專門開發的數學library
: : 你AMD要跑也不是不能跑啦
: : 只是慢到靠北而已
: : 一堆算矩陣的垃圾東西就是會有差這intel還AMD
: : 所以搞這方面的可憐肥宅工程師還是老實買intel+nvidia就好
: : 當然如果只是拿去打遊戲那您隨意就好了
: 這個情況現在可能好很多了
: Intel MKL 確實在數值運算上被廣為運用,不管是MATLAB還是Numpy都有使用。
: 而長期以來,AMD CPU因為沒有AVX2的關係被Intel電成豬頭
: 終於,在去年七月的時候,AMD 的第三代Ryzen支援AVX2了!
: 但是這樣子還是跑不贏Intel CPU,因為MKL他會認CPU來決定要不要啟用AVX2加速。
: 這也不是Intel耍陰招,因為你用某些很舊的Intel CPU也開不了。
: 情況好轉的部分是:
: 好事一
: MATLAB 在今年上半年的更新後,迫使MKL在使用 3rd Gen Ryzen 也會啟用 AVX2
: 好事二
: 除了 MKL,還有個類似的OpenBLAS也很快
: 這裡有人有進行比較 Link: https://bit.ly/33PUOpl
: https://i.imgur.com/95dF2WC.jpg
OpenBLAS 記得是基於 GotoBLAS 開發出來的
主要維護者是對岸的人
這版的 BLAS 它是把全部的 subroutine 對照
cpu都用 SIMD指令去處理
等於是硬幹 速度幾乎跟 Intel MKL一樣
目前還有一個 ATLAS => auto tuned blas
它是用程式自己去調整的 算是各有千秋
另外用MKL單獨去比 BLAS subroutine也不公平
BLAS 最複雜的 level 3 也只是 D = A*B + C
依照Intel的網站所講 它是在否些演算法上 使用平行運算
MKL 最主用的library就是 LAPACK
LAPACK其中的 Cholesky decomposition 本身就可以平行運算
至於求 SVD 使用 Householder reflector 也是可以使用平行運算
QR decomposition 也可以用 Householder reflector
還有LAPACK的 chetrd (reduce Hermitian matrix to tridiagonal form)
也是可以平行運算
LAPACK 很多演算法 都是要高手才知道細節的