AI超級集群時代即將來臨!這對AI晶片是利多,但會持續多久呢?
原文網址:https://bit.ly/3Oo2g2G
原文:
過去兩年來,營運大數據中心的公司一直在競相購買輝達的AI處理器。現在,一些最雄心
勃勃的參與者正在透過建立所謂的超級電腦伺服器集群來升級未來AI之戰。
xAI在幾個月內就在孟菲斯建造了一台名為Colossus的超級電腦,其中配備了 100,000顆
輝達的Hopper AI晶片,並宣稱全世界上最強大的超級集群。Meta執行長馬克祖克柏於
2024年10月表示,他的公司已經在使用一組晶片來訓練其最先進的AI模型,因為其也正積
極建立超級集群。
一年前,由數萬個晶片組成的集群就被認為是非常龐大了。根據瑞銀分析師估計,OpenAI
使用了大約10,000顆輝達AI晶片來訓練其於2022年底推出的ChatGPT版本。如今這一超級
集群風潮,開始吹向更多廠商。
也由於對這種更大超級集群的推動,正幫助輝達維持成長軌跡,使其季度營收從兩年前的
約70億美元增加到如今的超過350億美元。
迄今為止,將許多晶片安裝在一個地方,並透過超高速網路電纜連接在一起,可以以更快
的速度產生更大的AI模型,似乎成為風潮。換句話說,輝達AI熱潮的持續在很大程度上將
取決於最大的晶片集群的表現。這一趨勢不僅帶來了晶片購買熱潮,還刺激了對輝達網路
設備的需求,該設備正迅速成為一項重要業務,每年帶來數十億美元的銷售額。
如今看起來,用於訓練巨型AI模型的最大超級集群最多包含10萬顆輝達當前晶片。接下來
的下一代超級集群的起始數量約為10顆Blackwell晶片,這一性能提升將是明顯的。
對於xAI和Meta等公司來說,這一場資金賭注很高。它們一方面為了運算能力而相互競爭
,另一方面也打賭擁有更多的輝達晶片,將可轉化為相應更好的AI模型。除了xAI和Meta
之外,OpenAI和微軟也一直致力於為AI建立重要的新型運算設施。此外,谷歌也正在建造
大型數據中心來容納驅動其AI戰略的晶片。
根據SemiAnalysis研究,超級集群正從幾十個晶片一直擴展到10萬顆AI晶片,但沒有證據
其會持續擴展到100萬顆AI晶片和1000億美元的系統。可是馬斯克的下一步可能是在2025
年夏天為xAI和自動駕駛系統建立一個由輝達最新晶片組成的30萬顆晶片集群。
這是一個龐大的投資,畢竟,每一顆Blackwell晶片的成本約為3萬美元,這意味著10萬顆
AI晶片的超級集群將花費30億美元,那更不用說30萬顆AI晶片了。此外,隨著高耗能晶片
集群變得更加緊密,保持輝達晶片冷卻就變成一項重大挑戰。
這一場AI超級集群的遊戲,將是下一個值得關注的議題,這也會影響未來AI趨勢的發展啊
!