英特爾發佈全新芯片架構,六大技術戰略,震動芯片屆
https://xueqiu.com/9919963656/118217156
英特爾火了!英特爾真的火了!
北京時間12月12日對英特爾來說大事連連,在北京,正舉辦20歲生日的英特爾中國研究院
的隔壁樓房著了大火,而遠在大洋彼岸,英特爾在加州Los Altos舉辦的“架構日”上連
發大招!
英特爾高管、架構師和院士們展示了下一代技術,並介紹了英特爾在驅動不斷擴展的數據
密集型工作負載方面的戰略進展,從而為PC和其他智能消費設備、高速網絡、人工智能(
AI)、雲數據中心和自動駕駛汽車提供支持。
英特爾不僅展示了一系列處於研發中的基於10納米的系統,將用於PC、數據中心和網絡設
備,並預覽了其他針對更廣泛工作負載的技術,還一連分享了聚焦於六個工程領域的技術
戰略,包括:
1、先進的製造工藝和封裝。
2、可加速人工智能(AI)和圖形等專門任務的新架構。
3、超高速內存。
4、超微互連。
5、嵌入式安全功能。
6、為開發者統一和簡化基於英特爾計算路線圖進行編程的通用軟件。
英特爾表示,對這些領域的重大投資和技術創新,將為更加多元化的計算時代奠定了基石
,到2022年,潛在市場規模將超過3000億美元。
英特爾高級副總裁:摩爾定律將長存!
本次架構日的舉辦地加州Los Altos是仙童半導體與英特爾的聯合創始人Robert Noyce的
故居,該活動由英特爾公司處理器核心與視覺計算高級副總裁Raja Koduri與英特爾公司
高級副總裁兼硅工程事業部總經理Jim Keller擔任主講。
Jim Keller一出場就懟了所謂摩爾定律大限將至的說法,他表示,在他看完整個英特爾的
技術佈局之後,深覺得他能夠發揮的空間極大,他會讓摩爾定律在未來很長的一段時間內
持續下去,要大跌那些評論家的眼鏡。
▲英特爾公司高級副總裁兼硅工程事業部總經理JimKeller
Raja則認為如今數據產生速度已遠遠超過出現有基礎設施所能處理的速度,因此未來亟需
更高效、規模更大且更具可擴展性的計算架構。根據現場媒體的報導,Raja預言說,未來
10年計算架構的發展將遠超過過去50年的速度。
Raja提到,由於計算產業的轉變,未來英特爾在架構設計上也會越來越靈活,不但核心本
身的設計會更接地氣,同時也將更強調不同場景的計算適配,未來將引入CPU、GPU以外更
多的計算概念,構成xPU生態。
基於不同時代所需要的計算架構不同,Raja將整個計算軌跡分為三個階段,分別是2000年
左右的GHz時鐘速度階段、2005年開始的多核階段,以及未來的架構階段,未來架構將是
主導整個計算市場的最主要核心。Raja表示,英特爾將針對三大計算領域佈局更廣的計算
架構,包括CPU和GPU在內的這些架構都將混合更多元、更具彈性的計算能力。
▲英特爾公司處理器核心與視覺計算高級副總裁Raja Koduri
針對AI應用這一當下和未來的主流計算趨勢,英特爾也會在其主力架構中增加更多包含深
度學習、訓練以及推理計算加速的功能區塊。
其下一代 14nm 處理器Cooper Lake將引進 AI 模型訓練加速能力,支持 bfloat16的數據
格式,可達到比 fp32高兩倍的數據輸出能力。
Raja還大秀英特爾在CPU以及GPU方面的最新佈局,並展示未來英特爾CPU的核心發展路線
,剖析了整個計算市場的走向。他也介紹了其最新的 Gen 11 世代繪圖核心,並表示會將
規模持續做大,設計出更符合全方位計算與繪圖應用的獨立GPU架構,正面迎擊AMD與英偉
達。
此外,存儲、封裝以及服務器的技術佈局均在Raja本次全面介紹的射程之中。
作為xPU系列中的重要角色,Raja也不負眾望的揭曉了眾人關注的FPGA最新佈局。Raja介
紹道,新款的異構FPGA計算方案將會採用10nm製程,且規模將覆蓋到從過去的中低端方案
到高端方案,以同一架構不同規模的設計來解決不同層次的計算問題。而且下一代FPGA芯
片會引入3D封裝技術。
重拳出擊!六大技術新動向
值得一提的是,在封裝領域,英特爾推出的 Foveros 是業界首個真正的 3D 封裝,可以
把整個系統封進一顆芯片中,達成真正的 System in Package 概念,遠比目前台積電與
三星都在發展的 2D 或 2.5D 封裝技術更為先進。
1、業界首創邏輯芯片3D堆疊
英特爾展示了Foveros全新3D封裝技術,該技術首次引入了3D堆疊的優勢,可實現在邏輯
芯片上堆疊邏輯芯片,比目前台積電與三星在發展的 2D 或 2.5D 封裝技術要更先進。英
特爾預計將從2019年下半年開始推出一系列使用Foveros的產品。
首款Foveros產品將整合高性能10nm計算堆疊“芯片組合”和低功耗22FFL基礎晶片。 英
特爾稱,它將在小巧的產品形態中實現世界一流的性能與功耗效率。
據稱此封裝技術可做到約1mm的超薄厚度,Raja還在現場秀出僅有12mm x 12mm尺寸的量產
芯片。
Foveros為整合高性能、高密度和低功耗硅工藝技術的器件和系統鋪平了道路,有望第一
次將晶片的堆疊從傳統的無源中間互連層和堆疊存儲芯片擴展到高性能邏輯芯片,如CPU
、圖形和AI處理器。
因為設計人員可在新的產品形態中“混搭”不同的技術專利模塊與各種存儲芯片和I/O配
置,該技術提供了極大的靈活性,並使得產品能分解成更小的“芯片組合”,其中I/O、
SRAM和電源傳輸電路可以集成在基礎晶片中,而高性能邏輯“芯片組合”則堆疊在頂部。
英特爾表示, Foveros將成為繼2018年英特爾推出突破性的嵌入式多芯片互連橋接(EMIB
)2D封裝技術之後的下一個技術飛躍。
2、全新CPU微架構Sunny Cove
英特爾推出了接手 Skylake 的新一代CPU微架構Sunny Cove,旨在提高通用計算任務下每
時鐘計算性能和降低功耗,并包含了可加速人工智能和加密等專用計算任務的新功能。
Sunny Cove將在明年晚些時候成為英特爾下一代服務器(至強)和客戶端(酷睿)處理器
的基礎架構。
Sunny Cove的主要功能特性包括:
(1)增強的微架構,可並行執行更多操作。
(2)可降低延遲的新算法。
(3)增加關鍵緩衝區和緩存的大小,其一級緩存增大了50%,內存定址最大可定達
4096TB,可優化以數據為中心的工作負載。
(4)針對特定用例和算法的架構擴展。例如,提升加密性能的新指令,如矢量AES和
SHA-NI,以及壓縮/解壓縮等其它關鍵用例。
Sunny Cove不僅能夠減少延遲、提高吞吐量,而且提供更高的並行計算能力。英特爾表示
,它將有望改善從遊戲到多媒體到以數據為中心的應用體驗。
緊隨Sunny Cove之後,Willow Cove和Golden Cove也將分別對緩存、晶體管進行更多優化
,甚至會瞄準網絡設備和5G應用等來進一步強化 AI 等關鍵應用的性能表現。
3、全新第11代集成圖形卡
英特爾推出全新的第11代集成圖形卡,配備64個增強型執行單元,比此前的英特爾第9代
圖形卡(24個EU)多出一倍,旨在打破每秒1萬億浮點運算次數(1 TFLOPS)的壁壘。新
的集成圖形卡將從2019年開始與10納米處理器一起交付。此外,英特爾還重申了在2020年
推出獨立圖形處理器的計畫。
英特爾此前要在去年發佈第10代集成圖形卡,但由於改善幅度過小,最終該方案被捨棄,
轉而發展 11 代圖形卡。
與英特爾第9代圖形卡相比,新的集成圖形卡架構有望將每時鐘計算性能提高一倍。憑藉
高於每秒1萬億浮點運算次數的性能,該架構旨在提高遊戲的可玩性。
此外,英特爾在此次活動上展示的第11代圖形卡幾乎將一款流行的照片識別應用程序的性
能提高了一倍。
第11代圖形卡預計還將採用業界領先的媒體編碼器和解碼器,在有限的功耗配額下支持4K
視頻流和8K內容創作。第11代圖形卡還將採用英特爾自適應同步技術,為遊戲提供流暢的
幀速率。
4、One API軟件
英特爾還推出了新的One API項目,可以在單一開發環境之下,簡化跨CPU、GPU、FPGA、
人工智能和其它加速器的各種計算引擎的編程。
該項目包括一個全面、統一的開發工具組合,以將軟件匹配到能最大程度加速軟件代碼的
硬件上。其公開發行版本預計將於2019年發佈。
5、內存和存儲
英特爾還公佈了英特爾傲騰技術以及相關產品的最新情況。作為一款新產品,英特爾傲騰
數據中心級持久內存集成了內存般的性能、數據的持久性和存儲的大容量。
這項技術通過將更多數據放到更接近CPU的位置,能夠提高使應用在AI和大型數據庫中的
更大量的數據集能夠的處理速度。
其大容量和數據的持久性減少了對存儲進行訪問時的時延損失,從而提高工作負載的性能
。英特爾傲騰數據中心級持久內存為CPU提供緩存行(64B)讀取。
一般來說,當應用把讀取操作定向到傲騰持久內存或請求的數據不在DRAM中緩存時,傲騰
持久內存的平均空閒讀取延遲大約為350納秒。
如果實現規模化,傲騰數據中心級固態盤的平均空閒讀取延遲約為10,000納秒(10微秒)
,這將是顯著的改進2。
在一些情況下,當請求的數據在DRAM中時,不管是通過CPU的內存控制器進行緩存還是由
應用所引導,內存子系統的響應速度預計與DRAM相同(小於100納秒)。
英特爾還展示了基於英特爾1 TB QLC NAND裸片的固態盤如何把更多海量數據從硬盤遷移
到固態硬盤,從而可以更快訪問這些數據。
英特爾傲騰固態盤與QLC NAND固態盤相結合,將降低對最常用數據的訪問延遲。總體來說
,這些對平台和內存的改進重塑了內存和存儲層次結構,從而為系統和應用提供了完善的
選擇組合。
6、推出深度學習參考堆棧(Deep Learning Reference Stack)
英特爾宣佈推出深度學習參考堆棧(Deep Learning Reference Stack),這是一個集成
、高性能的開源堆棧,基於英特爾至強可擴展平台進行了優化。
該開源社區版本旨在確保人工智能開發者可以輕鬆訪問英特爾平台的所有特性和功能。深
度學習參考堆棧經過高度調優,專為雲原生環境而構建。該版本可以降低集成多個軟件組
件所帶來的複雜性,幫助開發人員快速進行原型開發,同時讓用戶有足夠的靈活度打造定
製化的解決方案。
(1)操作系統:Clear Linux 操作系統可根據個人開發需求進行定製,針對英特爾平台
以及深度學習等特定用例進行了調優;
(2)編排:Kubernetes可基於對英特爾平台的感知,管理和編排面向多節點集群的容器
化應用;
(3)容器:Docker容器和Kata容器利用英特爾虛擬化技術來幫助保護容器;
(4)函數庫:英特爾深度神經網絡數學核心函數庫(MKL DNN)是英特爾高度優化、面向
數學函數性能的數學庫;
(5)運行時:Python針對英特爾架構進行了高度調優和優化,提供應用和服務執行運行
時支持;
(6)框架:TensorFlow是一個領先的深度學習和機器學習框架;
(7)部署:KubeFlow是一個開源、行業驅動型部署工具,在英特爾架構上提供快速體驗
,易於安裝和使用。
結語:踏過荊棘的英特爾或將全面出擊
英特爾今年可以說是歷經風雨,在市場上和AMD、英偉達等競爭對手交鋒激烈,奉為聖經
的摩爾定律又屢遭質疑。Jim Keller直接懟回去業界的風言風語、力挺摩爾定律將長存的
行為,可以說是相當乾脆和直率。
在2018年收尾之際,英特爾這一波大秀肌肉,可見其不但對未來產品架構走向有著清晰、
全面且頗為自信的佈局,而且做好了從多方面解決問題並滿足一切計算需求的準備。
英特爾能否按著他們的既定計畫順利的走下去?10納米PC芯片能否在明年如約而至?這些
答案我們並不知道,但英特爾這次在戰略規劃上的全面佈局,針對行業發展痛點各個擊破
的做法,一方面會成為芯片產業下一階段發展很重要的參考,另一方面也讓我們看到作為
全球芯片巨頭的英特爾發起威來,虎軀一抖也足夠讓芯片屆為之一震
______________________________________________________________________________
AMD:重返榮......(Intel巴頭)