[閒聊] CPU 跨 Core 延遲測試

作者: SkyPlus (Sky)   2022-09-19 11:37:42
https://github.com/nviennot/core-to-core-latency
https://news.ycombinator.com/item?id=32889337
在 Hacker news 看到 CPU 跨 Core 延遲測試工具。
Github 上可以看到結果,基本上和設計上的限制一樣
Intel 12th 有趣的是 CPU 8 (P-core?) 到任一個 Core 都很快
E-Core 之間傳輸比 P-core 相對慢一點
AMD EPYC 7R13 是8個 core 一組再連接起來,
因此跨 group 的延遲從 23ns 變成 110ns
而 AWS Graviton2 是一個大 Arm 晶片,
64 Core 之間延遲都差不多
Hacker News 上有 Apple M1 Pro 的結果:
https://news.ycombinator.com/item?id=32892164
同樣可以看出是分成 4+4+2 三組
但跨 group 延遲比 AMD 高
0 59 231 205 206 206 208 219 210 210
59 0 205 215 207 207 209 209 210 210
231 205 0 40 42 43 180 222 224 213
205 215 40 0 43 43 212 222 213 213
206 207 42 43 0 44 182 227 217 217
206 207 43 43 44 0 215 215 217 217
208 209 180 212 182 215 0 40 43 45
219 209 222 222 227 215 40 0 43 43
210 210 224 213 217 217 43 43 0 44
210 210 213 213 217 217 45 43 44 0
作者: ltytw (ltytw)   2022-09-19 12:14:00
好的 英特爾又贏了一次
作者: tingstart   2022-09-19 12:14:00
記憶體控制器也會有延遲
作者: fmp1234 (刁民H)   2022-09-19 12:21:00
細膩
作者: wonder007 ( )   2022-09-19 12:33:00
膠水延遲
作者: jeff40108 (死得腥羶豔油劑是他)   2022-09-19 12:46:00
intel延遲贏這在zen剛出的時候就知道了後來蘇媽有改一版infinity fabric但還是輸一點但intel付出的代價也不小,server晶片的die size跟價格都壓不下來
作者: Transposon (跳死你)   2022-09-19 12:56:00
良率跟成本還是蘇媽贏啊
作者: iq1000x (台串彭于晏)   2022-09-19 12:57:00
使用者不太需要去考慮這麼細的事情吧最後整體跑出來多快才是使用者要的
作者: friedpig (烤焦棉花糖)   2022-09-19 12:58:00
牙膏13還是14gen P跟E溝通也有改進
作者: mrme945   2022-09-19 12:59:00
https://i.imgur.com/rJmL8hz.png Zen3八核內看起來延遲不錯,但超過就暴增了
作者: friedpig (烤焦棉花糖)   2022-09-19 13:01:00
就有沒有跨CCX的差別阿 只是單純的MCM要多快也難拉
作者: leung3740250 (jenius921)   2022-09-19 13:06:00
牙膏big.LITTLE還有很大的優化空間,big.LITTLE會拖累大核的latency,但不至於會高14ns
作者: friedpig (烤焦棉花糖)   2022-09-19 13:12:00
13Gen好像有正常了 但是E core內部的交換反而慢https://bit.ly/3ScstRz 小核叢集內慢是本來就有 13Gen沒改善 但大到小看起來沒啥問題了
作者: saimeitetsu (Sai Meitetsu)   2022-09-19 13:28:00
小笨賢:貼核,卡卡,numa
作者: leung3740250 (jenius921)   2022-09-19 13:40:00
因為小核內沒snoop filter因為10ff GMT妥協了不少東西
作者: friedpig (烤焦棉花糖)   2022-09-19 13:58:00
可憐那
作者: sdbb (幫我泡杯卡布奇諾)   2022-09-19 15:33:00
優文
作者: E6300 (漂流木村拓哉)   2022-09-19 17:21:00
牙膏那個能算是big little嗎?
作者: aegis43210 (宇宙)   2022-09-19 17:52:00
算呀,都特地設計了一個MCU來分配執行緒了
作者: kuma660224 (kuma660224)   2022-09-19 18:10:00
英特爾的小核是中核
作者: SHR4587 (SHR4587)   2022-09-19 18:35:00
那叫Big Midium好了,簡稱BM
作者: Beyondlife (超越人生)   2022-09-20 09:30:00
從延遲看起來還是主要侷限在物理結構層面,如果amd跨ccx延遲能壓到跟intel 12代水準,或是intel 的整體延遲能跟amd 單ccx延遲一樣那才是有趣
作者: friedpig (烤焦棉花糖)   2022-09-20 09:37:00
AMD要壓也不難 2.5D下去就好了 牙膏14 Gen就不鳥成本直接2.5D AMD大概還要等GG封裝有CP值才會大量用2.5D吧

Links booklink

Contact Us: admin [ a t ] ucptt.com