[情報] Intel內顯進化史

作者: hn9480412 (ilinker)   2016-03-25 23:23:20
http://www.expreview.com/46165.html
超能課堂(34):Intel內顯進化之路
2016-3-24 15:09
從第一代core處理器Clarkdale到今天的第六代core處理器Skylake,Intel
的整合內顯規模正在不斷的增大,性能也是以倍數增加,下面我們就來回顧
一下Intel的內顯進化歷程。
曾經很早的時候,內顯給人的印像只是能提供圖像輸出,玩遊戲什麼的
就別想了,然後過了些年,NVIDIA和AMD相繼推出了高性能集顯晶片組,也
就是C61與690G這類經典產品,讓大家見識到內顯也是能玩大型遊戲的,也
就是這些高性能內顯成就了當時AMD在低端平台的高性價比,隨後這些iGP就
被直接整合到CPU裡面了,現在整合顯卡的主機板已經很稀有了。
第二代到第五代core處理器內部核顯大小變化


AMD在收購ATI後,首先提出了CPU與GPU融合的概念,然而第一個把實際產品
做出來的卻是老對手Intel,早在2010年就推出了第一款整合GPU的CPU,隨
後Intel的內顯每年都會隨core系列處理器一同升級一次,現在已經發展到
了第六代,GPU的規模越長越大,以前是買CPU送GPU,現在都快成買GPU送
CPU了。


從第一代core處理器Clarkdale到今天的第六代core處理器Skylake,可見整
合內顯的規模正在不斷的增大,性能也是以倍數增加,而CPU每次升級都是
以提高能耗比為主,說真的從Sandy Bridge到Skylake CPU的性能提升幅度
並不算太突出,GPU性能反而成了每代處理器的性能提升重點,下面我們就
來回顧一下Intel的內核進化歷程。
首款整合GPU的CPU:Clarkdale


雖然說Intel的做法有點狡猾,但是2010年推出的Clarkdale處理器確實首款
整合GPU的CPU,這款處理器由32nm製程CPU Die和45nm的GPU Die共同封裝在
一塊PCB上組成,兩顆晶片使用QPI通道相連,通俗點來講Intel把CPU和北橋
晶片用膠水粘在了一起。
Clarkdale內核結構圖,GPU Die上包含了PCI-E控制器和內存控制器,其實
就是一個北橋晶片


Clarkdale系列處理器只有雙核的型號,有Core i5-600和Core i3-500兩個
型號,在LGA 1156時代四核處理器是沒有整合GPU的。
當時的Intel把Clarkdale上的GPU統稱為“Intel HD Graphics”,這名字一
直用到現在。而這個GPU其實就是G45上的X4500 HD的升級版,EU增加了兩個
達到了12個,核心頻率最高可以到900MHz,支援Hierarchical Z(層次Z緩
衝算法)與Fast Z Clear(快速Z清除)技術,支援DX10、SM4.0,支持
OpenGL 2.1,移動版處理器的GPU可以通過Turbo Boost動態調整頻率,而桌
面版不行。
真正的核顯:Sandy Bridge


Sandy Bridge核心圖
正在把CPU和GPU做到同一塊晶片上的是在2011年上推出的Sandy Bridge架構
處理器,CPU、GPU、記憶體控制器、PCI-E控制器全部整合到一個核心裡面,
它的最大改進在於三級緩存改用了環形總線設計,並且其核心、GFX以及顯
示/媒體控制器可共享L3快取記憶體。


Sandy Bridge的GPU主要包含了指令流處理器、媒體處理器、多格式媒體解
碼器、執行單元、統一執行單元陣列、媒體取樣器、紋理採樣器以及指令緩
衝等等,架構與上一代相比有了較大修改。
Sandy Bridge按照型號劃分了標準版以及“K”系倍頻解鎖版本,標準版本
GFX命名為HD Graphics 2000,而唯獨K系列所擁有的GFX為等級更高的HD
Graphics 3000,兩者的區別是前者擁有6個EU,而後者則達到了12個,全面
支持Turbo Boost動態調整頻率,最高頻率可達1350MHz,支援DX10.1、
SM4.1,支持OpenGL 3.0,性能上HD Graphics 3000比上一代有了翻倍的增
長。
此外這一代核顯還增加了Quick Sync轉碼加速技術,利用內置的編碼器可以
支援MPEG2、VC1和H.264視頻各種的硬體編碼,Sandy Bridge所整合的圖形
核心已實現了視訊解碼和編碼兩部分的硬體加速功能,可為使用者在視訊轉碼
時節省更多的時間。
迎來DX11時代:Ivy Bridge
Ivy Bridge架構圖


在Ivy Bridge上Intel針對內顯的改進還是兩個方向,首先是進一步提高GPU
的性能,並且讓其支援DX11,第二點則是繼續提高內顯的功能,多螢幕輸出、
高解析度支援等。


Ivy Bridge的GPU增強了幾何前端、光柵化、像素後端處理、採樣器、尋址
單元的並行運算能力,每週期可以執行2個MAC操作,GPU可以直接讀取L3
快取中的數據,圖形單元新增兩個可編程操作以及一個固定功能單元以支援曲
面細分計算,並在解碼與顯示功能上做了升級。
同樣的內顯也分為兩種,分別是有16個EU單元的HD 4000和6個EU單元的的HD
2500,“K”系列處理器用的是HD 4000而其他處理器用的是HD 2500,最高
頻率與SNB時代一樣是1350MHz,支援DX11、SM5.0,OpenGL 3.2,性能
上HD 4000比上一代的HD 3000提升了67%。
Ivy Bridge支援Quick Sync 2.0編碼加速技術,與第一代相比,2.0版不僅
速度更快,而且畫質也會更高。視訊輸出方面也從原來的雙螢幕上升到三螢幕輸
出,最大解析度從原來的2560*1600上升到4k*4k級別。
“Iris Graphics”登場:Haswell
Haswell架構圖
http://img.expreview.com/review/2013/05/Core_i7_4770K/Haswell_09.JPG
Haswell採用的是Gen 7.5內顯,這一代開始Intel的內顯開始了模組化、可擴
展的設計,Haswell的顯示核心採用兩級EU團簇結構設計,上級的叫Slice,
下級的叫Subslice,每個Subslice擁有10個EU,2組Subslice單元組成了1組
Slice單元,這一代在GT1和GT2兩個級別之上又誕生了GT3核心,從此Intel
就走上了暴力堆砌內顯規格的道路。


Haswell的GT1、GT2、GT3內顯分別擁有10個、20個和40個EU單元,此外還有
一個帶嵌入式eDRAM的GT3e,該內顯核心擁有128MB eDRAM,512bit頻寬可
達64GB/s ,這個嵌入式eDRAM是作為L4快取存在的,可以同時提升CPU和GPU
性能。
Intel的內顯一直以來都用HD Graphics來命名,不過與NVIDIA的GeForce還
有AMD的Radeon相比這個名字還是不夠霸氣,因此從Haswell處理器的核芯顯
卡開始,英特爾將引入新的名字“Iris ”和“Iris Pro”,中文名為“銳
炬”和“銳炬Pro”,分別對應GT3以及GT3e核顯,具體型號則是Iris
Graphics 5100和Iris Pro Graphics 5200。
這一代的桌面版core處理器基本上都是使用GT2核顯,型號是HD Graphics
4600/4400,後者只用在Core i3-41xx系列處理器上,只有16個EU,對非K系
列處理器來核顯性能是較上一代有大幅提升的,而真正需要高性能內顯的也
是Core i3那種級別的,高端處理器基本都是配個獨顯。
奔騰和賽揚處理器配的是GT1核顯,而這一代最強的GT3e核顯只出現在兩款
桌面級處理器上,就是Core i7-4770R和Core i5-4670R,然而這兩個都不零
售,是針對OEM市場的產品。
最強桌面核顯:Broadwell
Broadwell-H內部結構


Broadwell主要都是面向攜帶裝置市場,在桌面零售市場上其實就只有兩個CPU,
Core i7-5775C和Core i5-5675C,配備Intel目前最強的Iris Pro 6200核
顯,擁有128MB的eDRAM快取,另外無鎖倍頻,可進行超頻。
Broadwell上的Gen8 GPU架構示意圖


Broadwell上使用的是Gen8圖形核心,Intel重新設計了Subslice單元,每組
的EU單元從之前的10個下降到了8個,在同樣的採樣器及調度器下這意味著
每個EU單元的效率提升了,而彌補EU數量可以通過提升Subslice單元總數來
完成,所以Broadwell的1組Slice單元有3組Subslice單元,EU單元總數是24
個,Broadwell的GT1、GT2、GT3核顯分別擁有12個、24個和48個EU單元。
桌面零售版那兩個配備的Iris Pro 6200屬於帶eDRAM的GT3e核心,得益於核
心規模的大幅提升,Core i7-5775C的內顯性能較上一代Core i7-4790K提升
了將近80%,而已由於現在的Skylake桌面版只有GT2核心,所以Broadwell架
構的這兩款處理器成為目前擁有最強內顯的桌面級處理器,然而這兩個處理
器在中國根本沒有正式上市,要買的話比較難找。
越堆越大的GPU:Skylake
Skylake處理器核心


Skylake使用的Gen9代GPU其實與Gen8有很多地方都是相似的,每組Subslice
單元依舊是24個EU,但是最多可以擴展到3組Slice單元,也就是說最多會配
備72個EU單元,因此Skylake也多出GT4這個級別的核顯。
GT4內顯可以支持3組Slice單元,72個EU單元


Skylake的Gen9架構支援DX12、OpenCL 2.x、OpenGL 5.x、Vulkan等圖形規
範,支持新的編譯器堆棧,功耗範圍從4W-65W+不等。此外,Gen9還支持
HEVC/H.265、AVC、SVC、VP8、MJPG硬體加速,支援RAW架構。
多媒體方面,Gen9架構支持單一固定功能單元以降低功耗,Quick Sync轉碼
單元也設計了固定功能的編碼器以降低功耗、延遲。此外,Gen9的視訊解
碼、轉碼加速還支援了HEVC(H.265)、VP8、MJPEG等標準。
Skylake處理器上啟用全新的核顯命名


然而GT3/GT3e/GT4e這樣的高性能內顯只使用在移動版處理器上,桌面版的
Skylake處理器基本上都是使用只有24EU的GT2,雖然較桌面版Haswell來說
性能還是有所提升,但是幅度只有20%。另外還有兩個“P”後續的處理器用
的是GT1內顯。


從Gen1到Gen9,Intel的圖形核心性能有上百倍的提升
Intel這些年來在內顯確實下了不少功夫,性能提升幅度相當的大,入門級
顯卡基本上都被內顯趕盡殺絕了, 而反觀CPU,性能提升幅度就沒那麼明顯
了,降低功耗反而成了重點,低功耗的處理器造就了現在超級本和各種
Windows平板的盛行,而這些年來移動設備都上高解析度螢幕,這對內顯又
有了性能上的需求,市場的需求影響了Intel近年來的處理器改進方向,未
來Intel CPU也是以提升內顯性能並降低整體功耗為主。
不過跟AMD相比的話,AMD有遊戲廠商的加持,可以透過驅動程式來對遊戲來作最佳化
所以用AMD的APU來玩遊戲似乎比用Intel還要好很多
Intel的內顯技術比較偏向商業應用
但是不知道AMD有沒有打算在Zen的消費級APU上面實現內顯使用HBM的技術....
作者: charlie20083 (查理)   2016-03-26 00:23:00
我記得有人說一代跟二代Core i的GPU上Win 10會怪怪的?

Links booklink

Contact Us: admin [ a t ] ucptt.com