輝達不滿足在GenAI領導的現狀,推出新架構和軟體服務,往全方位AI公司前進
原文網址:
https://bit.ly/43pXnwC
原文:
輝達在2024年GTC會議上,提出了其未來營運的兩大重點。第一:重塑下一的底層架構,
使其GPU晶片成為GenAI革命中極其重要的一部分。其次,它宣布了一系列廣泛的工具和合
作夥伴關係,使各種類型的企業將GenAI應用程式投入生產的過程變得更加容易。
在此過程中,輝達也強調了其成為軟體和服務公司的雄心壯志,發布了AI Enterprise
5.0和新NIM(Nvidia Inference Microservices)。 該公司還成功擴大了應用範圍以及
致力於提供關鍵GenAI運算解決方案的產業,包括:醫療保健、重工業、汽車、機器人、
製造、電信(6G)、天氣預報等。
在晶片方面,自兩年前推出Hopper架構以來,新一代Blackwell GPU架構誕生。輝達表示
,Blackwell提供的20 PetaFLOPS人工智慧效能在AI訓練工作負載上快了4倍,在AI推理工
作負載上快了30倍,最值得注意的是,其能源效率比Hopper提高了25倍。
儘管單一Blackwell GPU的功能已經很強大,但在MoE(Mixture of Experts ) AI「超級
模型」的新時代,迫切需要將大量的GPU連接在一起。因此,新的NVLink 5.0技術就變得
很重要,因為它允許最多576顆GPU以高達1.8 TB/Sec的速度連接在一起。
與上一代產品一樣,輝達還整合了一款“超級晶片”,將其最新的GPU與基於Arm的CPU設
計結合起來。最新的超級晶片版本稱為Grace Blackwell 200(或簡稱 GB200),它包括
兩個Blackwell GPU和一個Grace CPU。
該公司還推出了一系列新的交換機,包括基於InfiniBand的Quantum-X800交換器和基於乙
太網路的Spectrum-X800。兩者都利用該公司的BlueField技術來加快將資料透過數據中心
輸入GPU進行處理的過程。
即使主要的雲端供應商都正在研發自己的解決方案,但其和伺服器製造商仍都宣布很快就
會推出基於Blackwell設計的服務或系統。此外,還有一些軟體供應商也宣布他們將在其
應用程式的下一代版本中支援Blackwell和這些最新設計。
至於軟體,輝達的重大軟體是引入了NIM的微服務,它是AI Enterprise 5.0版本的一部分
。這些微服務是在CUDA軟體平台之上運行的Web原生容器,專門設計用於簡化創建和開發
可利用CUDA和輝達硬體的GenAI應用程式的過程。
未來這些新的微服務可以為輝達創建全新的營收來源和業務策略,因為它們可以按每個
GPU/hr(以及其他變體)進行授權。這是輝達新營收的嘗試,值得關注。
總之,輝達不僅在硬體上,期望拉大與競爭者差距,也想利用新的軟體應用程式和微服務
希望將公司定位為更廣泛、更重要的GenAI產業長期推動者。顯然,輝達不滿足於現今的
領先地位,而想要拉長領先產業的時間,成為真正AI的王者呢!