[心得] X86 架構下的 Memory Model

作者: Instance (呆呆華)   2021-07-18 11:24:10
大多時間在家有點無聊,花了點時間研究以前一知半解的東西。
不過要強調的是,這篇文章只針對 X86。
std::atomic 有六種 Memory Order 選項:
memory_order_relaxed,
memory_order_consume,
memory_order_acquire,
memory_order_release,
memory_order_acq_rel,
memory_order_seq_cst
這六種模式在 X86 底下幾乎沒什麼差別的,
用最弱的 memory_order_relaxed 就可以了,
因為 X86 是屬於 Strong Memory Model 的架構。
Load-Load, Store-Store, Load-Store 情況下是安全的。
Store-Load 情況下表示,
A 執行緒儲存某一變數,
其他執行緒必須同步讀到最新的數值,
這時就必須用到原子操作。
如果要理解原子操作的話,
最簡單的方法是從硬體角度來思考。
現代的 CPU 有 L1, L2, L3 Cache,
如果你的電腦有多個核心,
當資料放在 L1, L2 Cache 時,
並不保證所有核心對某一變數的值是一致的。
而進行原子操作的動作之後,
變數的值會同步到所有核心的 Cache。
原子操作的方法有很多種:
1. std::atomic<int> x;
2. std::atomic_thread_fence(std::memory_order_relaxed);
3. asm volatile("mfence" ::: "memory"); // 組合語言
4. asm volatile("lock; addl $0,0(%%rsp)" ::: "memory", "cc"); // 好像是更快的組合
語言,我不是很了解
5. InterlockedExchange(); // Win API
效果都是將變數的值同步到所有核心,
這樣才能保證多執行緒環境下此變數的全局可見,
Win API 或許效能會稍差一點吧。
參考文章:
C++11中的內存模型上篇 - 內存模型基礎
https://tinyurl.com/f36rsus9
C++11中的內存模型下篇 - C++11支持的幾種內存模型
https://tinyurl.com/95e33cf5
X86/GCC memory fence的一些見解
https://zhuanlan.zhihu.com/p/41872203
作者: sarafciel (Cattuz)   2021-07-18 22:36:00
呃...我建議原PO去補一下圖靈獎神書計算機架構你這篇文章從原子操作開始的東西除了參考應該都是錯的
作者: final01 (牛頓運動定律)   2021-07-18 23:11:00
有書在講這個??好像都是網路文章吧?所以很片段XD
作者: sarafciel (Cattuz)   2021-07-18 23:25:00
CA也不是專門講這個的書啦XD 但是要理解這部分issue對CPU的設計跟加速原理要有一定程度的認識
作者: poyenc (髮箍)   2021-07-19 02:10:00
好奇你怎麼不看 Hans-J. Boehm 的提案還有論文, 而是看網路上的文章
作者: EricTCartman (阿ㄆㄧㄚˇ)   2021-07-19 17:39:00
好奇要是一開始就知道要看Boehm的論文還會願意發文給樓上酸?
作者: Caesar08 (Caesar)   2021-07-20 01:28:00
樓上,這也不是甚麼很神秘的資訊,google memory order上面就有寫每一個的內容是甚麼。看不懂也有spec可以讀

Links booklink

Contact Us: admin [ a t ] ucptt.com