IThome
AI超級電腦「臺灣杉二號」建置完成,明年上半將加入服務行列
今日(13日),國研院國網中心公布了新超級電腦「台灣杉二號」,全名為「雲端服務及
大數據運算設施暨整合式階層儲存系統」(簡稱AI雲端平臺),它在11月發布的全球超級
電腦500強中,以9 PFLOPS的實測計算效能,躋身第20名,創下臺灣超級電腦史上最佳紀
錄,而上一次最好成績是在2007年6月(第35名)。
為解決近年國內高速計算資源不足的問題,在科技部支持下,國研院國網中心先是在5月
宣布,正式啟用新造超級電腦「台灣杉」,並汰換服役長達近7年的「御風者」,現在,
另一AI運算為主的超級電腦「台灣杉二號」也到了建置完成階段,預計再經過幾個月的最
後測試,包括軟體服務的整合,與內部調校和優化,明年上半就能正式啟用,一同加入服
務行列。
根據國網中心的聲明,新的超級電腦台灣杉二號由252個節點組成,每個節點包含2顆CPU
(Intel Xeon Gold)及8顆GPU(Nvidia Tesla V100 w/32GB),總計安裝多達2,016顆
GPU,與先前以CPU計算節點為主、GPU為輔的台灣杉相比,側重面向明顯大不同。因此,
在科研應用上,台灣杉二號在運用大數據進行深度學習時,將能提供更出色的效能。
在9 PFLOPS運算量之外,省電也是新超級電腦的一大重點。與台灣杉相同的是,台灣杉二
號也採用了對應高效運算主機的水冷技術,以降低機房電費成本,這也符合當今全球超級
電腦設計的趨勢。
基本上,台灣杉二號採冷熱通道隔離與異質雙水溫冷卻系統設計(常溫水+冰水),透過搭
配2套不同解熱之鈑式熱交換器的方式,分別供應水冷機櫃及氣冷機櫃所需的冷卻效能。
特別的是,台灣杉二號的能源效率達11.285 GF/W(當計算量在9 PFLOPS時,用電為798
KW),在Green500能源效率榜上排名第10名,不僅比台灣杉更出色,並且名列全球最節能
的前十大超級電腦。而且,它的PUE值最低將可達到1.1、1.2,顯然比起一般資料中心的
1.7、1.8更低。
打造臺灣首座AI超級電腦,供學研機構及新創團隊使用
其實,國網中心在今年上半曾經預告,AI主機10億元的採購案已決標,這臺國內自研自製
的AI超級電腦,將由廣達、臺灣固網與華碩雲端結盟的團隊負責安裝,並建置在與台灣杉
超級電腦所在的同一機房當中,同時,也宣告預計安裝完成時間就在年底之前。隨著這次
的發布,也顯示新超級電腦一如預期建置完成。
而根據這次主機建置商華碩的聲明,在國網中心負責設計監造之外,關於主機建置上的分
工,主要是由台灣大哥大負責機房建置與資安維運,廣達負責AI運算及資料儲存平臺,而
華碩負責雲端服務平臺、雲端伺服器及AI應用整合。
從此次AI主機的執行計畫來看,目的上,也就是為了建構國家級AI研發與雲端服務環境,
做為國內發展人工智慧的重要基礎。
對於未來AI雲端平臺的應用,在國網中心發表的聲明中已經提到,未來會將一半的運算資
源,提供給政府主導的計畫,例如智慧機器人、自駕車實驗場域、AI創新研究中心等前瞻
計畫與學研界使用;另一半的運算資源,則將提供創新產業使用,包括像是人工智慧應用
於金融科技、智慧製造、智慧醫療/健康及智慧城市等領域,進一步促進各個產業,能運
用人工智慧帶來創新、加值及應用,期許帶動國內產業及AI廣泛應用領域的蓬勃發展。
https://imgur.com/DcPwIlJ
比起由2排機櫃組成的「台灣杉」,新造超級電腦「台灣杉二號」不僅運算效能更強大,
佔用機房面積也更廣,由4排機櫃組成,兩排機櫃兩兩相對。事實上,這兩座超級電腦位
於同一機房當中,在我們先前參觀台灣杉超級電腦時,旁邊還有約20~30坪的可使用空間
,台灣杉二號即座落於該處。(上圖前方看到的四排機櫃,就是台灣杉二號,而畫面中最
右邊深處,則是今年五月已經上線的台灣杉)
相較於已經淘汰且佔用6排機櫃「御風者」,這兩座新建超級電腦的佔地面積加起來,約
跟老舊的御風者相當,但提供的運算量與計算能源效率,將更加出色數十倍。(圖片來源
:國網中心)
https://imgur.com/1yQ3guG
一般而言,超級電腦大概每5年更新汰換一次,而之前臺灣的超級電腦「御風者」撐了近7
年。去年開始,政府在超級電腦方面有了更多新的規畫,包括像是今年5月正式啟用的「
台灣杉」(TAIWANIA),以及近期公布建置完成的「台灣杉二號」(TAIWANIA 2)。特別
一提的是,在最新11月發布的全球超級電腦500強中,國內這臺主機方面建置就投入10億
的「台灣杉二號」,以9 PFLOPS的實測計算效能,擠身全球第20名,而上一次最好成績,
是在十年之前的2007年6月,當時我國的超級電腦躋身全球第35名。(圖片來源:國網中心
)
#台灣杉2號詳細規格一覽
硬體(整體規格):
●252個節點/9,072個CPU核心
●2,016顆GPU
●193.5 TB記憶體
●10 PB儲存容量
●Mellanox InfiniBand EDR 100Gbps叢集互連網路
●1.2 PUE硬體
(單一節點規格):
●2顆18核心Xeon Gold 6154 ●8顆Nvidia Tesla V100 SXM2 32GB
●768 GB 記憶體 ●240 GB SSD + 4TB NVMe SSD
軟體環境:
●Slurm / Kubernetes
●Nvidia NGC Docker
●Ceph
●Spectrum Scale(GPFS)
●CentOS
AI架構:●Tensorflow ●Caffe / Caffe 2 ●PyTorch / Torch ●其他
資料來源:國網中心,iThome整理,2018年11月
https://www.ithome.com.tw/news/126983