[情報] Zen5 AVX512 分析

作者: SkyPlus (Sky)   2024-08-08 09:39:45
http://www.numberworld.org/blogs/2024_8_7_zen5_avx512_teardown/
雖然 Zen5 初期測試報告有點不盡人意
不過剛剛看到這篇文章大力讚揚 Zen5 AVX512 設計,
和 Zen4 AVX512 相比, Zen5 IPC成長幾乎快了 100%
這是因為 Zen4 用 4 x 256-bit 的通道組合出來
連 Intel 只有 server 等級的 Sapphire Rapids 才給的起 2 x 512-bit
但這次 zen5 桌面版大核就很大方的給了 4 x 512-bit
因此反映在效能上就直接爆漲了
另外 Intel 常被詬病 AVX512 需要先花一些時間(約50000 cycle)低速跑,
等電上去,CPU降速才能全速跑。但 Zen5 可能靠設計和製程完全解決這問題,
不需降速也不用等,下指令後幾乎立即全速運作。
此外 Intel 在 Tiger Lake 加了 AVX512-VP2INTERSECT 指令,
但速度超級慢 (25 cycle),大家都用別的指令去模擬還比較快,
因此 Intel 在往後的 CPU 也移除他。
這次 Zen5 實作了這個指令,而且只花 1 cycle 就完成。
綜合這些分析,他認為Zen5可以說第一次讓大家看到完整版的 AVX-512。
反觀 Intel 設計了卻四處限制...
他還有提到 Cinebench, CPU-Z 都沒有很認真測試 AVX-512,
因此看不出Zen5在這方面的優勢。
不過有些 Zen4 可以在 1 cycle 做完的非 AVX-512 SIMD,
在 Zen5 反而不明原因退步到 2 cycle,
另外混合 AVX-256,512 指令的順序不對也會變慢

Links booklink

Contact Us: admin [ a t ] ucptt.com