顯示卡各種參數
2011年04月10日
常見的顯示卡參數分為以下三部分:
一、顯示核心(晶片廠商、代号、型号、架構、頻率、象素渲染管線、頂點着色引擎數、3D API、RAMDAC頻率及支援MAX分辨率等)。
二、顯存顆粒(類型、封裝類型、位寬、容量、速度、頻率)
三、PCB闆(PCB層數、接口、供電位、散熱器)
一、顯示核心
顯示核心就是所說的GPU,它在顯示卡中的作用,就像電腦整機中CPU的一樣,GPU主要負責處理視訊資訊和3D渲染工作。很大程度上GPU對一張顯示卡的性能好壞起到決定性的作用。常見的顯示晶片廠商分别有ATI、nVIDIA、Intel、SIS、Matrox和3D Labs。其中Intel和SIS主要生産內建顯示晶片,而Matrox和3D Labs則主要面向專業圖形領域。目前主流的獨立顯示卡晶片市場主要被兩大派系占據,它們分别是ATi和nVIDIA,而由于ATi現在已經被AMD收購,以後顯示卡市場上的争奪戰,将由AMD-ATi和nVIDIA主演。
晶片代号:
核心代号就是顯示晶片的開發代号。制造商在對顯示晶片設計時,為了友善批量生産、銷售、管理以及驅動程式的統一,對一個系列的顯示晶片給出了相應的代号。相同的核心代号,可以根據不同的市場定位,再對核心的架構或核心頻率、搭配的顯存顆粒進行控制,不同型号的顯示晶片因而産生,進而可以滿足不同的性能、價格、市場,起到細分産品線的目的。
晶片型号:
以晶片型号細分晶片代号這種做法,還可以将當初生産出來,體格較弱的顯示卡晶片,通過屏蔽核心管線或降低顯示卡核心頻率等方法,将其處理成完全合格的、較為低端的産品。如nVIDIA的GeForce 7300GT和7600GT為兩個型号的顯示卡,它們同樣采用了代号為G73的顯示核心,而為了區分兩者的級别,7600GT擁有12條渲染管線和5個頂點着色器,而7300GT則被縮減至8條渲染管線和4個頂點着色器。是以,雖然7300GT和7600GT雖然同樣采用了代号為G73的顯示晶片,但兩者仍然是有差別的。同一種開發代号的顯示晶片的渲染架構以及所支援的技術特性是基本上相同的,而且所采用的制程也相同,是以開發代号是判斷顯示卡性能和檔次的重要參數。同一類型号的不同版本可以是一個代号,例如:GeForce (X700、X700 Pro、X700 XT) 代号都是 RV410;而Radeon (X1900、X1900XT、X1900XTX) 代号都是 R580 等,但也有其他的情況,如:GeForce (7300 LE、7300 GS) 代号是 G72 ;而 GeForce (7300 GT、7600 GS、7600 GT) 代号都是 G73 等。
核心架構:
像素渲染管線
在傳統顯示卡的管線架構中,經常說道某張顯示卡擁有X條渲染管線和X個頂點着色單元。而像素渲染管線又稱像素渲染流水線,這個稱呼能夠很生動的說明像素渲染流水線的工作流程,是顯示晶片内部處理圖形信号互相獨立的的并行處理單元,是顯示核心中負責給圖形配上顔色的一組專門通道,是顯示核心中單獨設計的一組電路,擁有單獨的半導體。一條流水線定義是“Pixel Shader(像素着色器)+TMU(紋理單元)+ROP(光栅化引擎,ATI将其稱為Render Back End)。從功能上簡單的說,Pixel Shader完成像素處理,TMU負責紋理渲染,而ROP則負責像素的最終輸出,是以 ,一條完整的傳統流水線意味着在一個時鐘周期完成1個Pixel Shader運算,輸出1個紋理和1個像素。像素渲染單元、紋理單元和ROP的比例通常為1:1:1,但是也不确定,如在ATi的RV580架構中,其像素渲染流水線就基于1:3的黃金渲染架構,每條像素渲染管線都有着3個像素着色器,是以一塊X1900XT顯示卡中,具有48個像素渲染單元,16個TMU(紋理單元)和16個ROP。過去的顯示卡核心架構中,像素渲染管線的數量是決定顯示晶片性能和檔次的最重要的參數之一,在相同的顯示卡核心頻率下,渲染管線越多也就意味着更大的像素填充率和紋理填充率,那麼所繪出的圖形它的填充效率就越高,自然我們看到的畫面也就越流暢越精美。這就是為什麼渲染管線越多越好的原因。
頂點着色引擎
我們可以将像素渲染管線了解成為一張3D圖形的上色過程,而這個3D圖形的建構,則是由頂點着色引擎(Vertex Shader)來執行的。頂點着色引擎主要負責描繪圖形,也就是建立幾何模形,每一個頂點将對3D圖形的各種資料清楚地定義,其中包括每一頂點的x、y、z坐标,每一點頂點可能包函的資料有顔色、最初的徑路、材質、光線特征等。頂點着色引擎數目越多就能更快的處理更多的幾何圖形,目前許多新的大型3D遊戲中,許多獨立渲染的草叢和樹葉由大量多邊形組成,對GPU的Vertex Shader(頂點着色器)要求很大,在這個情況下,更多頂點着色引擎的優勢就被展現出來。
舉個例子吧:現在要顯示卡繪出一個茶壺。當這個茶壺的頂點資訊從顯存傳到頂點着色單元後,頂點着色單元就會依據這些資訊繪出這個茶壺的輪廓。接下來像素渲染管線就會依據這個輪廓,把從顯存中的有關這個茶壺的顔色等資訊讀出來,給這個茶壺上色,如果這個茶壺是白色的,就上白色的。然後再由紋理貼圖單元貼上精美的圖案,最後這個精美的茶壺就出來了。
統一渲染架構
這一概念的出現,其初衷就如前面說到,在目前許多新的大型3D遊戲中,許多獨立渲染的場景由大量多邊形組成,對GPU的Vertex Shader(頂點着色器)要求很大,而這時相對來說,并不需要太多的像素渲染操作,這樣便會出現像素渲染單元被閑置,而頂點着色引擎卻處于不堪重荷的狀态,統一渲染架構的出現,有助于降低Shader單元的閑置狀态,大大提高了GPU的使用率。統一渲染架構可以了解為将Vertex Shader、Pixel Shader以及DirectX 10新引入的Geometry Shader進行統一封裝。此時,顯示卡中的GPU将不再開辟獨立的管線,而是所有的運算單元都可以任意處理任何一種Shader運算。這使得GPU的使用率更加高,也避免了傳統架構中由于資源配置設定不合理引起的資源浪費現象。這種運算單元就是現在我們經常提到的統一渲染單元(unified Shader),大體上說,unified Shader的數目越多,顯示卡的3D渲染執行能力就越高,是以,現在unified Shader的數目成為了判斷一張顯示卡性能的重要标準。
核心頻率:
顯示核心的核心頻率在一定程度上反映出核心的運作性能,就像CPU的運作頻率一樣。我們前邊已經說過顯示卡在核心架構上的差異,而如果在相同核心架構的前提下,核心頻率越高的顯示卡其運作性能就越好,此一說法可以針對于傳統渲染流水線體系的GPU。而nVIDIA在最新的8系列顯示卡中,提出了核心頻率與Shader頻率異步的概念。由于DX10采用了統一渲染架構,它将Vertex Shader、Pixel Shader和Geometry Shader進行了統一封裝,稱為統一渲染單元(unified Shader),核心渲染頻率就是這些unified Shader的運作頻率,通常核心頻率和Shader頻率的比值為1:2。而在顯示核心中,Unified Shader以外的工作單元,如texture單元和負責最終輸出的ROP單元還是受到核心頻率的影響的。在nVIDIA的DX10顯示卡中,除了核心頻率現在還多了Shader頻率。在DX10顯示卡中,ATi的Radeon HD 2000系列和NV的8系列不同,ATi依然沿用了核心頻率同步的工作方式,是以Radeon HD 2000系列核心頻率的高低,對一張顯示卡3D性能仍然起到了至關重要的作用。
3D API
API是Application Programming Interface的縮寫,是應用程式接口的意思,而3D API則是指顯示卡與應用程式直接的接口。3D API實際顯示卡與軟體直接的接口,程式員隻需要編寫符合接口的程式代碼,就可以充分發揮顯示卡的不必再去了解硬體的具體性能和參數,這樣就大大簡化了程式開發的效率。目前主要應用的3D API有:DirectX和OpenGL。
RAMDAC頻率和支援最大分辨率
RAMDAC(Random Access Memory Digital-to-Analog Converter 随機數模轉換記憶體)。它的作用是将接收到的圖像信号轉化為相應的模拟信号。RAMDAC的轉換速率以MHz表示,它決定了重新整理頻率的高低。其工作速度越高,,高分辨率時的畫面品質越好。該數值決定了在足夠的顯存下,顯示卡最高支援的分辨率和重新整理率。如果要在1024×768的分辨率下達到85Hz的重新整理率,RAMDAC的速率至少是1024×768×85×1.344(折算系數)÷106≈90MHz。目前主流的顯示卡RAMDAC都能達到350MHz和400MHz,已足以滿足和超過目前大多數顯示器所能提供的分辨率和重新整理率。
二、顯存顆粒
顯存與系統記憶體一樣,也是多多益善。顯存越大,可以儲存的圖像資料就越多,支援的分辨率與顔色數也就越高。以下計算顯存容量與分辨率關系的公式: 所需顯存=圖形分辨率×色彩精度/8。 例如要上16bit真彩的1024×768,則需要1024×768×16/8=1.5M,即2M顯存。 對于三維圖形,由于需要同時對Front buffer、Back buffer和Z buffer進行處理,是以公式為:所需顯存(幀存)=圖形分辨率×3×色彩精度/8。 例如一幀16bit、1024×768的三維場景,所需的幀緩存為1024×768×3×16bit/8=4.71M,即需要8M顯存。 顯示卡本身擁有存儲圖形、圖像資料的存儲器,這樣,計算機記憶體就不必存儲相關的圖形資料,是以可以節約大量的空間。顯存的大小決定了顯示器分辨率的大小及顯示器上能夠顯示的顔色數。一般地說,顯存越大,渲染及 2D 和 3D 圖形的顯示性能就越高
顯存封裝:
顯存封裝是指顯存顆粒采用的封裝技術類型,封裝的目的就是避免顯存晶片與空氣中的雜質和具有腐蝕性的氣體接觸,防止外界對晶片的損害,進而造成顯存性能的下降。不同的封裝技術在制造工序和工藝方面差異很大,封裝後對顯存晶片自身性能的發揮也起到至關重要的作用。一般來說,現在常見的封裝類型有TSOP(Thin Small Out-Line Package) 薄型小尺寸封裝和MicroBGA (Micro Ball Grid Array) 微型球閘陣列封裝、又稱FBGA(Fine-pitch Ball Grid Array)。其中TSOP封裝類型的顯存,其特征為有這類封裝類型的顯存顆粒,有兩側的腳針裸露在外,而形狀一般呈長方形。TSOP封裝現在的制造技術比較成熟,可靠性也比較高。同時這類封裝顯存具有成品率高、價格便宜等優勢。對比TSOP封裝的顯存産品來說,mBGA封裝類型的顯存在功耗方面有所增加,但其采用的可控塌陷晶片焊接方法使得産品有着更佳的電氣性能。同時由于這類顯存在厚度和重量上都比TSOP封裝有所改善,是以産品的産品的附加參數減少 、信号傳輸延遲也更小,産品的工作頻率及超頻性能都有了顯著的提高。而mBGA/FBGA封裝的特征為看不到針腳,形狀亦沒有TSOP封裝類型那麼長。目前,我們見到的顯存顆粒都是使用這種mBGA的封裝類型。
顯存位寬:
顯存位寬是顯存在一個時鐘周期内所能傳送資料的位數,位數越大則瞬間所能傳輸的資料量越大。顯存位寬=顯存顆粒位寬×顯存顆粒數,常見的顯存位寬有64bit,128bit,256bit,320bit和512bit,從顯存位寬上可以判斷一張顯示卡的級别,通常來說,顯存位寬越高的顯示卡級别越高。而一張顯示卡的顯存位寬,一般是由顯示卡核心的顯存位寬控制器決定的,是以就算搭配了8顆16M*32bit的GDDR3顯存顆粒的GeForce 8600GTS顯示卡,其顯存位寬也僅是128bit,這是因為GeForce 8600GTS的核心已經規定了顯存位寬的規格為128bit。
顯存容量:
顯存容量很好了解,顯存容量越大,所能存儲的資料就越多。需要指出的是,并不是所有的顯示卡,顯存容量越大就越好,現在有許多中低端顯示卡,如GeForce 8500GT、GeForce 7300GT都配備了512MB的顯存容量,其實這對中低端顯示卡的性能是沒有任何影響的。你拿一個水缸到一個湖裡打水,你打到多少的水不取決于這個湖的水量有多大,而是取決于你的水缸有多大。
顯存速度:
我們常見的顯示卡參數中,還可以看見如DDR3:1.4ns這類參數,這裡的DDR3表示的則是顯存類型,而後面的1.4ns表示的則為顯存速度,顯存速度一般以ns(納秒)為機關,越小表示顯存的速度越快,顯存的性能越好。常見的顯存類型中,GDDR2顯存速度由4.0ns~2.0ns,GDDR3顯存速度由2.0ns~0.8ns。
顯存頻率:
顯存頻率亦為最常見的顯示卡參數之一,它一定程度上反應着該顯存的速度,以MHz(兆赫茲)為機關。DDR顯存的理論工作頻率計算公式是:顯存理論工作頻率(MHz)=1000/顯存速度*2。顯存帶寬=顯存位寬X顯存頻率X顯存顆粒數/8,在顯存頻率相當的情況下,顯存位寬将決定顯存帶寬的大小。例如:同樣顯存頻率為500MHz的128位和256位顯存,那麼它倆的顯存帶寬将分别為:128位=500MHz*128