[PCIe] Panmnesia 開發出新型 CXL 技術,有望突破 GPU VRAM 限制

作者: ECZEMA (加油!)   2024-07-04 12:03:20
剛在看 HBM 搶奪 DDR5 產能,可能造成 DRAM 價格飆漲時,
旁邊 Tom's hardware 剛好在講新的 CXL 協議可讓 PCIe DRAM 甚至 SSD 去當 VRAM 給 GPU 用
搜了下中文剛好有篇熱騰騰剛出的,分享給顯卡版大家。
照之前 Intel AMD 都支援舊的 CXL 規格來看,新的 CXL-Opt 若也能被支援,將可大幅減化 GPU HBM 成本和系統複雜性
https://is.gd/NL01cu
Panmnesia 開發出新型 CXL 技術,有望突破 GPU VRAM 限制
透過 PCIe 連接記憶體和 SSD
by JC 2024-07-03 in 新聞
韓國公司 Panmnesia 開發出革命性 CXL 技術,使 GPU 能透過 PCIe 來增加 VRAM,甚至可使用 SSD。
Panmnesia CXL 帶來 VRAM 擴充新紀元
現代 AI 和高性能運算 (HPC) 領域的 GPU 受限於內建高頻寬記憶體 (HBM) 的容量,影響其在 AI 和其他工作負載中的表現。然而,一項新技術的出現可能徹底改變這一局面。這項技術允許企業通過 PCIe 匯流排連接更多記憶體設備,甚至可以使用 SSD 來擴充 GPU 記憶體容量。
Panmnesia 突破性技術
由韓國知名 KAIST 研究所支持的 Panmnesia 公司,開發出一種可用於擴展 GPU 記憶體的 CXL 技術。由於當前 GPU 缺乏支援 DRAM 和 (或) SSD 的 CXL 邏輯架構和子系統,另外,GPU 快取和記憶體子系統僅識別統一虛擬記憶體 (UVM),而 UVM 速度較慢。
https://imgur.com/pRxPdTI.png
為解決這些問題,Panmnesia 開發了一個符合 CXL 3.1 標準的根複合體 (RC),其特點包括:
配備多個支援 PCIe 外部記憶體的根埠 (RPs)。
具有主機管理設備記憶體 (HDM) 解碼器的主機橋接器,連接 GPU 的系統匯流排。
HDM 解碼器管理系統記憶體的地址範圍,使 GPU 記憶體子系統「誤認」正在處理系統記憶體。
Panmnesia 的解決方案 (標記為 CXL-Opt) 經過廣泛測試,顯示出令人印象深刻的性能:
往返延遲僅為兩位數奈秒,相比之下,三星和 Meta 開發的原型延遲為 250 納秒。
執行時間比 UVM 縮短 1.94 倍,比 CXL-Proto 縮短 1.66 倍。
IPC 值比 UVM 快 3.22 倍,比 CXL-Proto 快 1.65 倍。
這項技術的出現可能對 AI / HPC GPU 產生重大影響,有望擴充 GPU 記憶體容量,滿足日益增長的 AI 訓練資料集需求。另外,也能提高大規模 AI 模型訓練的效率,以及延長現有 GPU 硬體的使用壽命,降低企業成本。
然而,仍存在一些未知因素,比如 AMD 和 NVIDIA 等主要 GPU 製造商是否會支援 CXL 技術,甚至他們是否會使用 Panmnesia 等公司的 IP 區塊,還是開發自己的技術等都還是未知。
但整體來說,Panmnesia 的 CXL 技術為 GPU 記憶體擴充開闢新的可能性,不僅可能改變 AI 和 HPC 領域的 GPU 應用方式,還可能推動整個行業向更靈活、更高效的方向發展。隨著技術的進一步成熟和可能的廣泛採用,可以期待看到更多創新應用和突破性進展。
作者: kkcity59 (kkcityk)   2024-07-04 13:15:00
可是PCI-E就這麼慢...還要再透過CPU的記憶體控制器H100單個GPU記憶體頻寬為3,938 GB/sPCIE 16x 5.0也只有64GB/s第五代的NVLink也高達1800GB/s
作者: ECZEMA (加油!)   2024-07-05 02:18:00
快絕對沒直接安在GPU上快 就算PCIe 7.0 16x也一樣 便宜且簡化記憶體廠製程研發 或是HPC模組廠的散熱管理 大局觀是否各產業都有利,才是會不會被採用的重點

Links booklink

Contact Us: admin [ a t ] ucptt.com