不惜堆料的旗艦“芯”王，索泰 GeForce RTX 4090 PGF OC顯示卡評測

前言

試問大家，RTX40系顯示卡中，誰的性能給你震撼一擊？想必不少玩家都會選擇大名鼎鼎的GeForceRTX4090顯示卡。不過這張頂級顯示卡還可以再更新！最近筆者就收到了一張頂尖水準的RTX4090顯示卡，各方面堪稱極緻，甚至突破功耗上限，為的就是給極客玩家帶來更極緻的體驗。

不惜堆料的旗艦“芯”王，索泰 GeForce RTX 4090 PGF OC顯示卡評測

熟悉索泰的玩家應該知道，索泰一直有個PGF系列，它是索泰顯示卡中最頂級的存在，不過這個系列在RTX40系顯示卡中還沒有誕生新成員。今天它來了！一釋出就是天花闆級别的索泰GeForceRTX4090PGFOC顯示卡，無論是外觀顔值，還是内在用料，它都是當之無愧的非公卡皇，我們也在第一時間上手了這張性能怪獸，下面一起看看它有怎樣的恐怖表現~

下文“索泰GeForceRTX4090PGFOC”簡稱為“索泰RTX4090PGFOC”

規格對比

開始看這張頂級卡皇前，先給它來個詳細的身份識别，這張索泰RTX4090PGFOC用上了AD102-301核心，相比原本的RTX4090，應該是做了一些優化。晶片面積還是熟悉的608mm2，當然啦，也因為用的是TSMC4N工藝，是以小小的核心内塞下了763億個半導體。至于它與公版RTX4090的差別還是在于功耗和頻率的設定上。全新推出的索泰RTX4090PGFOC雖然預設功耗還是450W，但它可以在此基礎上上調17%，也就是說600W不成問題。

并且BOOST頻率上也有加成，公版的RTX4090為2520MHz，而索泰RTX4090PGFOC的BOOST頻率能夠去到誇張的2625MHz，足足高了有105MHz！再聊聊它的這顆AD102核心，我們也是總結了目前40系顯示卡的所有核心，AD102核心可以稱得上是地表最強的遊戲顯示卡核心了，384bit位寬、144個SM、96MB的L2緩存……，每一項都在告訴你，它就是最Top的存在。

不過我們從圖上的規格表還是可以發現，目前GeForceRTX4090顯示卡中配備的AD102-300或AD102-301核心其實并非完整的AD102核心。下圖展示的為完整的AD102核心，它應該包括了12個GPC(圖形處理叢集)、72個TPC(紋理處理叢集)、144個SM(流式多處理器)和⼀個帶有12個32Bit顯存控制器的384Bit顯存位寬。這也證明了完整的AD102核心是留給未來可能推出的RTX4090Ti顯示卡的。

再來看下面的GeForceRTX4090架構圖，和完整版本的AD102核心對比起來就很容易看出差别。首先，GeForceRTX4090核心代号為AD102-300或AD102-301，其擁有9個完整規格的GPC(圖形處理叢集，每個内建6個TPC)，與2個非完整的GPC(圖形處理叢集，每個内建5個TPC)，共組成了64個TPC，SM單元為128個，相比完整版少了16個。至于顯存位寬老黃還是手下留情了，保留了完整的384Bit。

外觀賞析：索泰 GeForce RTX 4090 PGF OC

見過不少索泰的顯示卡包裝盒，唯獨索泰RTX4090PGFOC的包裝盒讓我眼前一亮。大面積的線條與圖形使用和這次的PGF系列設計不謀而合，彰顯了“lessismore”的核心主張，給玩家豐富的意象空間。

拆開包裝盒，索泰RTX4090PGFOC盡顯眼底，不得不說它的外觀設計颠覆了我的想象。過往的PGF系列更多采用黑色色調，外觀上都是硬核機甲風。這回的索泰RTX4090PGFOC可以說是大刀闊斧的改變，圓潤的外殼設計多了許多流線型的柔美，為顯示卡注入了流動與韻律，打破使用尖銳線條勾勒顯示卡外觀的傳統。

索泰RTX4090PGFOC頂級的不止在它的外觀設計，體積方面也是Top的存在，足足有2.4kg重，這就是一塊有着超強性能的“闆磚”

是以為了應對這個重量級的顯示卡，索泰也在包裝盒内附贈了全金屬的顯示卡支架，既美觀又能杜絕顯示卡變形，給予顯示卡有效保護。少不了的還有電源轉接線與RGB線，甚至連說明書都專門做了收納，細節拉滿。

視角回到顯示卡身上，整張顯示卡以白色為主打色，中間有黑色的緞帶貫穿始終，不過與黑色的風扇恰如其分，黑白撞色設計在視覺效果上既時尚前衛，又帶來了一種沉靜之感與中和之意，靜谧而平衡，同時也暗藏了一絲絲電競硬核風格，設計相當超前。

細看正面，圓潤的外殼下是三把11cm的巨大散熱風扇，它們采用雙滾珠軸承設計，并且運用了空氣動力學原理，增加了風扇厚度，加深風扇外罩，這有利于風流集中，大幅提升散熱效率。中間的風扇還機智的采用反向旋轉，能夠有效減少亂流、降低噪音。

每把風扇的扇葉也有小設計，仔細看可以看到每一片扇葉上都有鱗狀仿生條紋，官方稱其為盾鱗2.0高壓扇葉，扇葉的曲率也有改善，這些小改動可以提高風扇的進風量、風壓與風流，讓冷空氣吹透整個散熱鳍片，幫助顯示卡快速降溫。

顯示卡背面的設計同樣驚豔，首先映入眼簾的就是巨型的”PGF”标志，代表了速度、力量和科技三重含義。旁邊還有專門的PGFLogo信仰燈點綴，與白色的金屬背闆結合，顔值拉滿。

雖然金屬背闆設計會給顯示卡增重，這是因為索泰增加了合金加強骨骼結構部件，但它有利于鞏固顯示卡、不易變型，而且還可以提升散熱效能，加上背闆末端設有開孔設計，有效加強風扇氣流。

索泰的顯示卡少不了的就是辨識度，頂部是我們熟悉的ZOTAC信仰Logo與NVIDIA顯示卡特有的GEFORCERTX辨別。

顯示卡供電用的是全新的12VHPWR供電接口，使用一根12VHPWR的電源線就可達到供電需求。如果你沒有用上最新的電源，還可以使用随機附贈的4x8Pin轉12Pin的電源線轉接使用。

轉頭看看顯示卡底部，一排排散熱鳍片已經快要突出外殼了，可以預見這款顯示卡的散熱相當出色。

顯示卡底部還可以看到顯示卡的PCIe金手指，标準的PCIe4.0x16速率，它可以為顯示卡提供更快的傳輸速度。

視訊輸出接口方面配備了3個DP1.4a和1個HDMI2.1，支援4屏顯示或最高8K@60Hz的超清輸出。

換個角度，再看看它的厚度，74mm，這已經超越了4槽了，果然高端的顯示卡都有非同尋常的重量。381mm的長度對不少機箱也是一個考驗，ITX機箱基本就不要想着能裝進它了，大機箱才是它的歸宿。

RGB燈效：索泰 GeForce RTX 4090 PGF OC

高貴冷豔的外觀大家都看過了，那下面就來點不一樣的，相信沒有哪個玩家能夠拒絕RGB的誘惑吧~

顯示卡通電後，頂部的索泰ZOTAC信仰Logo燈率先亮起，多彩的變化加上醒目的設計，辨識度算是拉滿了。

不過要說這最吸睛的還要看正面的燈帶，在三把散熱風扇的四周，索泰安排了一圈的RGB燈帶，顯示卡點亮時猶如律動的音符，遠望就好像與風扇起舞。在邊緣處更是嵌入了一條綿延不絕的燈帶，光彩動人。

索泰可不光在正面安排了RGB，在背部也藏了RGB設計，獨有的PGFLogo信仰燈與頂部的ZOTACLogo信仰燈互相呼應，共同點綴着這張高貴的卡皇。

每一處角落都不能放過，就連你很少能夠見到的顯示卡側邊也塞下了RGB，支援1600萬色ARGB及多種燈效模式。當你在機箱正面看去，格外靓麗。

玩燈那總要可以自定義吧，索泰的FireStorm軟體就內建了這個功能，玩家可以用它自定義RGB，在電源接口的旁邊還有OPENARGB接口，通過附贈的線即可實作整機燈效同步，實作千變萬化的燈效設計，打造專屬于你的靓麗顯示卡。

純白的外觀配上豔麗的燈光效果，相信不少玩家看完都已經芳心暗許了吧，再來個白色的機箱打造白色主題裝機，又是一件完美的藝術品。

顯示卡拆解：索泰 GeForce RTX 4090 PGF OC

索泰RTX4090PGFOC雖然看起來很厚實，不過拆解起來還是相當輕松的，傳統的“三明治”結構。卸下金屬背闆上的螺絲後就可以分離整個散熱系統與PCB闆。

整張顯示卡的PCB闆就突出“進階”二字，黑色的色調加上合理規整的設計，一眼就能看出它出自大廠之手。正面是各式各樣的供電晶片、電感、核心以及顯存，密密麻麻鋪滿了整個PCB闆。

再看看它的背部，強迫症看了都直呼舒服，并且索泰還在核心背部電容位置使用了四個POSCAP(導電聚合物钽電容)代替四組MLCC(一組10個MLCC)，整體電氣性能更強。

終于輪到我們的主角了，這顆AD102-301-A1核心四平八穩的鑲嵌在PCB的正中央。你以為它隻是小小的一顆晶片，其實它得益于TSMC4N工藝，在裡面塞下了763億個半導體，這個數量足足是RTX3090Ti的2.7倍！

核心的周邊則是12顆GDDR6X顯存，來自美光科技，型号為2RU47D8BZC，單顆顯存容量2GB，12顆組成24GB超大顯存。并且這幾顆顯存的速率可是滿血的，顯存速率為21Gbps。

俯瞰整張PCB，你就可以發現，它的供電規模也堪稱豪華，采用了SEP2.0供電系統。供電總相數來到了誇張的28相，其中24相為核心供電，4相為顯存供電，并且供電內建度相高，每相均采用了固态電容做輸入輸出，還有全封閉電感坐鎮。

左側PCB供電

右側PCB供電

無論是核心供電還是顯存供電，索泰均采用了統一規格的DrMos晶片，可見是下了血本了，晶片來自萬國半導體，封裝型号為BLN0與BLN3，實際應為AOS的AOZ5311NQI與AOZ5311NQI-03，二者持續輸出電流均為55A。

核心供電DrMos

顯存供電DrMos

PWM主要則位于PCB的背部，型号分别是：uP9512R、uP9512U以及uS5650Q。其中uP9512R與uP9512U共同管理核心供電，可以做精細化的供電管理。

uP9512R

uP9512U

而面積最小的uS5650Q則擔任電壓/電流/功耗監控的工作。

供電規模的強悍還需要有個接入口，索泰RTX4090PGFOC采用了最新的12VHPWR接口，單口供電能力可達600W，帶動這顆“核彈”完全沒有問題。

不過供電不止12VHPWR接口一處，PCIe也是供電之一，索泰RTX4090PGFOC的PCIe接口為标準的PCIe4.0x16，值得注意的是使用前一定要在主機闆打開ResizableBAR功能，這張顯示卡的性能才能完全釋放。

當然，上面提及晶片，PCB上還有衆多不可或缺的晶片，例如在核心周圍還能看到兩顆BIOS控制晶片，型号為IS25WP016，分别控制這款顯示卡的預設BIOS與極速BIOS。

我們繼續拆解它的散熱系統，可以看到索泰RTX4090PGFOC承襲了索泰“堆料王”的品質，一眼就見到了超大面積的VC均熱闆，它能夠迅速吸收GPU産生的熱量，并将熱量迅速均勻傳遞到熱管，讓AD102核心時刻保持冷靜。

在VC均熱闆的四周是一片又一片定制的高K導熱墊，它們覆寫了顯存、電感、MOS感等發熱大戶，讓其與散熱模組之間無縫連接配接，散熱的同時還能減少嘯叫幾率。中間的核心區域則是厚厚的矽脂，給核心專供，如此高規格的配置，為的就是讓這款頂級顯示卡能夠全力釋放性能。

不僅僅正面的超大VC均熱闆有散熱，金屬背闆上同樣安排了特設高K導熱墊，配合金屬導熱性強的特性，索泰RTX4090PGFOC的散熱規格足以用恐怖來形容。

而中間的散熱器才是散熱系統中體積最大的一個，散熱器本體為兩段式散熱子產品，左右兩側均有全覆寫高密度鍍鎳鳍片，搭配全新對流穿透散熱設計，能夠大大提升顯示卡散熱效能。

散熱鳍片下隐藏着9根冰脈熱管，全部采用精密的無損内嵌焊接工藝，熱管設計也經過全面更新，增加熱管壁厚度和内壁脈絡狀導液溝槽，還用上了更高導熱系數的媒體，為的就是給AD102核心滿血釋放的舞台。

有了不錯的熱管，還需要風力十足的散熱風扇快速帶離熱量，正面的三個11cm的散熱風扇便是最大的功臣。風扇采用雙滾珠軸承，盾鱗2.0高壓扇葉多達11片，厚度還增加了不少，是以能帶來更強的風壓和風流，實作無死角風流覆寫，配合顯示卡内部散熱部件擁有更加出色的散熱效果。

最後來個全家福，索泰RTX4090PGFOC的内部構造就像富麗堂皇的皇宮，應有盡有。旗艦級的AD102核心、旗艦級的散熱規格才對得起旗艦PGF的定位。

測試平台介紹

索泰RTX4090PGFOC的裡裡外外大家都見證過了，下面就該真刀真槍的上機測試了。還是編輯部的天花闆配置，CPU用的是最新的IntelCorei9-13900KS，華碩的Z790Hero主機闆搭配2根16GB的金士頓DDR5-6000高頻記憶體。

有了強悍的硬體，顯示裝置也不能拖後腿，顯示器我們采用了愛攻&保時捷聯名PD32M電競顯示器，其搭載了目前頂級的4K144Hz面闆，可以完美體驗到RTX4090帶來的絲滑4K144Hz遊戲體驗。

理論性能測試

國際慣例，跑分前先給這張索泰RTX4090PGFOC顯示卡來個全身體檢，從圖中可以看到這款顯示卡的基準頻率為2235MHz，Boost頻率為2625MHz，遠遠高于公版FE的2520MHz，足足105MHz的提升，這也是它為什麼被索泰稱為旗艦之作的原因之一。

再看看它的功耗與溫度牆限定，不得不說高端顯示卡就是非同凡響，索泰RTX4090PGFOC的預設TGP設定為450W，不過這是普通的RTX4090的極限，不是索泰RTX4090PGFOC的極限，它支援解鎖功耗，最大TGP可至530W，溫度牆也是給到了88℃，看來超頻測試是少不了了。

先看看索泰RTX4090PGFOC的基準性能吧，這裡選用3DMark作為測試工具，從測試結果中可以看出，索泰RTX4090PGFOC對RTX3090Ti就是碾壓，在DX11為基準的FireStrike系列測試中，67806的超高成績比後者高出僅1W多分，性能提升幅度達到了近20%，而在DX12為基準的TimeSpy中，38122的超高分數同樣強過RTX3090Ti的22379分。

不過要說提升最大的就得屬光追與老黃引以為傲的DLSS了，在PortRoyal測試中，索泰RTX4090PGFOC領先RTX3090Ti就有23%以上！而在DLSS方面，這張顯示卡的提升堪稱恐怖，2K下開關DLSS可以有超百幀的差距，更離譜的是8K下，僅開啟DLSS2也能做到60FPS流暢運作。

而在其他理論性能測試中，索泰RTX4090PGFOC更是王者風範，例如在GPGPU理論中，擁有AdaLovalace架構的RTX40系列顯示卡在算力上也有出色的性能表現，尤其是單精度和雙精度浮點運算上，提升幅度是最大的。索泰RTX4090PGFOC整體性能相比RTX3090Ti的性能提升足足有92%左右，不少項目更是2倍甚至3倍的飛躍，着實讓筆者越測越興奮。

遊戲性能測試

再來就是玩家最期待的遊戲性能測試了，想必買這張卡的玩家應該都不缺4K顯示器吧，這裡我們就着重說說它的4K以及8K表現了。不過還是給大家看看它在1080P跟2K的表現，索泰RTX4090PGFOC就是亂殺，大部分遊戲都在200FPS以上，這已經不是入門電競的水準了，而是專業電競的表現。

重點來了~4K分辨率才是這款顯示卡的主戰場，先挑個優化最差的《賽博朋克2077》試試手，可以看到索泰RTX4090PGFOC顯示卡在DLSS2下，遊戲幀數已經有77FPS，你可能覺得不多，那看看隔壁的RTX3090Ti，48FPS的表現真的不夠看，當然你别忘了它還有DLSS3加持，有“大力水手”的加成，幀數還能有不小的飛躍。

8K在以前隻能說是幻想，現在它已經成為了現實！在8K遊戲測試方面，索泰RTX4090PGFOC顯示卡能夠将大部分遊戲跑到60FPS以上，這已經遠遠超乎筆者的想象，而像一些優化好的遊戲，例如《極限競速：地平線5》甚至能有85FPS左右的表現，這還隻是DLSS2的表現，相信加上DLSS3，性能應該更為強悍。

總的來說，索泰RTX4090PGFOC可謂是不負衆望，1080P、2K對它猶如砍瓜切菜般簡單，4K分辨率下，即使隻開DLSS2，依舊有不錯的體驗，如果你玩的遊戲有DLSS3，那體驗更是質的飛躍，至于8K嘛，目前的體驗隻能說良好，基本可玩，後續如果遊戲優化得當，8K電競應該指日可待。

DLSS 3性能實測

提到RTX40系顯示卡就不得不提DLSS3這個黑科技了，它無疑是這代顯示卡更新的重點，相比DLSS2，DLSS3不僅可以實作畫質于幀數的雙向提升，還新增幀生成功能，實作遊戲幀數翻倍，老黃在釋出會上更是直言“DLSS3讓遊戲性能翻倍”！

3DMarkDLSS3理論性能測試

還是老樣子，先驗一下DLSS3的實際理論性能，實測下來有DLSS3的加持下，索泰RTX4090PGFOC顯示卡相比RTX3090Ti實作了性能的翻倍，在4K分辨率下，不開DLSS3僅能勉強維持在60FPS附近，一旦開啟DLSS3後，性能直接提升三倍，180+FPS的驚人表現直接超出RTX3090Ti100多FPS。

8K也是從容不迫，不開啟任何DLSS時，強如RTX4090也隻有13FPS，不過上面我們也看到了索泰RTX4090PGFOC在DLSS2下，8K已經可以跑60FPS了，如果用DLSS3，拿直接逼近百幀！

遊戲實測

光有理論測試，沒有實際遊戲怎麼行，我們這裡就用顯示卡殺手《賽博朋克2077》來“折磨”一下這張頂級卡皇，特别是現在的《賽博朋克2077》還有負載壓力更大的全景光追模式，這又是一項挑戰。

首先我們先看看在超級光追下的表現，DLSS2下，索泰RTX4090PGFOC的表現已經相當不錯了，4K分辨率可以跑到111FPS，這已經能夠滿足4K@120Hz高刷電競了；換到DLSS3我們再測一次，144FPS的表現完美诠釋了它的旗艦定位，再看看2K或1080P，超200+FPS的成績更是唬人。

換裝上壓力更大的全景光追後，我們先在DLSS2下進行體驗，不得不說這個級别的光追壓力确實大，強如索泰RTX4090PGFOC也隻能勉強60FPS運作。至于2K或1080P的表現就會好很多，不過這是一張40系顯示卡，還有DLSS3這個黑科技，在開了DLSS3後，索泰RTX4090PGFOC在4K分辨率下也能有105FPS的出色表現，雖然比超級光追模式下低了一些，不過全景光追的畫面真實度值得你體驗！

另外，眼尖的小夥伴應該也發現了，開啟DLSS3後，遊戲的1%LowFPS均有不同程度的提升，幅度在15-20FPS間浮動，别小看這十幾幀的差距，在遊戲中，1%LowFPS越高，你的遊戲體驗就會更絲滑，遇到卡頓的情況就會減少，這也是DLSS3的一大優勢。

讓我們再看看另一款支援DLSS3的遊戲《F122》，索泰RTX4090PGFOC依舊強勢，在4K畫質下開啟全高特效，有了DLSS3的加成，索泰RTX4090PGFOC能夠跑到163幀，若隻使用DLSS2，則幀數隻有85幀左右，相當于DLSS3這個黑科技給遊戲帶來了50%的遊戲性能提升，相當不錯。

當然了，DLSS3除了能夠有效提升遊戲幀數外，畫質也是一等一的強，這裡我們也截取了DLSS3各個檔位下的遊戲實際畫面，可以看到無論是哪個檔次，遊戲畫質均沒有明顯影響，甚至因為DLSS3是通過AI進行超分渲染，是以在文字等細節紋理上會比原生畫質更加清晰。

DLSS3-F122-DLSS-Balance

DLSS3-F122-DLSS-Perfoemance

DLSS3-F122-DLSS-Quality

DLSS3-F122-DLSS-SuperPerfoemance

DLSS3-F122-TAA

就拿F122内的場景來說，五個不同的檔次，畫質幾乎沒有差別，老黃的DLSS3可以說是把RTX40系顯示卡的遊戲體驗推到了更高的層級，遠遠強于上代的RTX30系顯示卡。

UnrealEngine5LyraDLSS3測試

最後我們還測試了利用UnrealEngine5引擎打造的LyraDEMO，此DEMO除了能夠支援最新的DLSS3技術外，還帶上了NVIDIAReflex。筆者這裡上傳了兩個圖檔給大家看看LyraDEMO裡的DLSS3開啟與關閉的畫質對比，遊戲流暢度自然是DLSS3開啟後提升較為明顯的，達到192FPS，而PCL延遲也進一步降低到了50ms的水準。

Unreal-Engine-5-Lyra-DLSS3-OFF

Unreal-Engine-5-Lyra-DLSS3-ON

更多測試

如果你覺得這些還不夠過瘾，我們也安排了更多遊戲的實測，1080P大家應該不用想也知道，這張卡就是爆殺，這裡給大家展示2K、4K以及8K的成績。

首先是2K分辨率下，開啟DLSS2的索泰RTX4090PGFOC相比起前代卡皇已經大幅領先了，一旦開啟了DLSS3，這張顯示卡仿佛脫缰的野馬！2K下不少遊戲有了300+的幀數表現，看來還是太小看這張索泰RTX4090PGFOC了，4K甚至8K才是它的戰場。

提升分辨率至4K，索泰RTX4090PGFOC終于能夠大展身手了，開關DLSS2與DLSS3，遊戲幀數竟有30-40FPS的差距，這還隻是跟它自己比較。如果你用索泰RTX4090PGFOC與RTX3090Ti相比，那簡直就是降維打擊，超強的性能讓它可以4K@144Hz暢玩3A大作。

視訊内容創作性能測試

遊戲表現可以說是相當的驚豔，那生産力創作上索泰RTX4090PGFOC又有怎樣的驚喜！這裡我們選擇PugetBench、PCMark10、Blender等多款常見的測試軟體，來測試這款顯示卡在日常辦公、視訊内容生産、專業渲染等方面的性能表現。

首先是PCMark10Extended項目，索泰RTX4090PGFOC顯示卡在每個項目上都完成了超越，整體性能領先前代的RTX3090Ti達到了15%左右，不過根據我們前面的測試，領先幅度遠不止于此，畢竟單是遊戲中就是幾十上百幀的差距。

而在視訊内容創作上，索泰RTX4090PGFOC得益于更快的顯存于更強的性能，跑Pugetbench的Pr項目确實比前代卡皇快了很多，有大約30%的性能提升。如果你用達芬奇進行測試，那索泰RTX4090PGFOC的優勢會更加明顯，畢竟AV1編碼是30系顯示卡不曾擁有的技術，後續我們也會對這部分進行更詳細的測試。

專業内容創作性能測試

既然是創作，那除了視訊内容當然還有專業的渲染與工業軟體，在N卡常用的Blender渲染軟體中，索泰RTX4090PGFOC相比RTX3090Ti有97%的性能提升！你沒有聽錯，就是翻倍的性能表現！RTX40系的性能果然不讓人失望。

同樣出色的還有OC渲染器，索泰RTX4090PGFOC的表現真的是頂級的存在，性能也提升了95%以上，想要提升專業性能的使用者不妨考慮一下這張索泰RTX4090PGFOC，頂級的顯示卡頂級的體驗，當然你也将獲得頂級的效率。

像SPEX的專業領域我們也沒有放過，當然我們的索泰RTX4090PGFOC沒有辜負我們的期待，65%的性能提升充滿驚喜。這也得益于全新架構的加持，才讓這款顯示卡能夠實作如此“變态”的性能提升。

NVIDIA雙編碼器測試

上面我們也提到了RTX40系列還藏有一項黑科技可以加速你的視訊内容創作，其實就是它的第八代NVIDIA雙編碼器，它支援時下熱門的AV1編碼，作為下一代主流的視訊編碼技術有着自己獨特的優勢，更快的編碼速度和更高品質的流媒體傳輸性能，讓越來越多的剪輯軟體和視訊網站青睐于它，像我們熟悉的達芬奇、剪映、B站等已經支援AV1編解碼，未來AV1将會成為一個新趨勢。

先看看大家關心的速度，我們選用NVIDIA提供的樣片進行導出測試，有第八代NVENC雙編碼器加持的索泰RTX4090PGFOC确實能帶來更好的性能表現，同樣是H.265視訊輸出，它的效率就要比上代顯示卡快多了；若你是輸出8K30的視訊，這張天花闆級别的RTX4090隻需要46秒就能完成了，相比之下隔壁的RTX3090Ti卻要170秒，幾乎是4倍的效率提升！

另外我們再來看看H.265格式與AV1格式下的畫質差別，從肉眼來看，其實畫質幾乎完全一樣，這樣也意味着AV1可以用更小的空間占用量實作與H.265同等規格的畫質表現，總的來說，無論是導出速度、空間占用還是畫質表現，它都完勝H.265。

AI性能測試

AI是現在這個時代的浪潮，不到一年的時間裡，AI已經席卷了各行各業，各式各樣的AI工具接踵而至。而作為AI時代最大的赢家老黃在GTC上、在COMPUTEX2023上都大談AI，甚至說“現在就是AI的iPhone時刻”，甚至為了讓大家感受AI的魅力，進一步推出了一系列AI産品與服務，震撼全場。

借着這個機會，我們也對索泰RTX4090PGFOC顯示卡進行AI運算能力測試，在使用達芬奇AIACCELERATEDMAGICMASK測試時，同一項目下，架構革新後的索泰RTX4090PGFOC有着更快的渲染時間，原本RTX3090Ti需要幾十秒才能完成的操作，現在僅用17秒！

要說測AI又怎麼能夠少得了生成式AI中最經典的StableDiffusionAI畫圖呢，擁有24GB超大顯存的索泰RTX4090PGFOC顯示卡可以說是這裡的最強王者！選擇NVIDIA提供的描述，生成50張768x768的圖檔，索泰RTX4090PGFOC以1分鐘19張圖的速度一騎絕塵，作為對比，上代的RTX3090Ti則是一分鐘11張圖，可見架構革新确實能夠帶來不小的性能提升，換用新的RTX40系顯示卡也能讓你在AI時代乘風破浪。

RTX VSR測試

AI的能力大家看完了，再給大家看個有意思的。素有視訊版DLSS的RTXVideoSuperResolution視訊超分辨率技術（RTXVSR）終于上線了。在RTX4090上市那會兒，這項技術還沒釋出，現在剛好有索泰RTX4090PGFOC顯示卡，那就用這張顯示卡看看，頂級的性能加上超強的AI技術，究竟能不能将低分辨率的視訊也提升到前所未有的效果。

首先開啟RTXVSR需要你的顯示卡為30系或40系，在NVIDIA控制台中找到視訊圖像設定，手動開啟RTXVideoenhancement即可啟用RTXVSR技術，其中分為1-4檔調節，數字越大品質越好。

實測環節，可以看到在開啟RTXVSR技術之後，原視訊裡的人物線條由原本的模糊不清變得十厘清晰銳利，甚至部分細節已經超越原生1080P了，并且低畫質的視訊也有不少噪點，在開啟VSR4檔後，噪點幾乎消失。

除此之外，由于是AI智能提升分辨率的緣故，字型在原生的480P視訊中有些發虛，甚至字型邊緣可以看到毛邊，不過有了VSR的加持後，字型銳利可見，完全不輸原生1080P的效果，不得不說VSR确實有點東西。

這裡我們也給大家準備了對比視訊，從視訊裡就可以看到VSR的效果之明顯，最進階别的VSR4跟原生480P相比就是一眼的差別，在開啟RTXVSR技術後，部分圖像品質有了顯著提高，不僅鋸齒和噪點幾乎全部消失，顔色過渡也更為平滑，目前VSR能有這種表現堪稱驚豔。

左：原生480P中：VSR4檔右：原生1080P

當然你除了在浏覽器能夠使用這項功能外，本地浏覽器也能享受黑科技的魅力，VLC是目前首個支援RTXVSR技術的本地播放器，且能夠支援多種視訊格式播放，你硬碟裡的老視訊也能擁有清晰畫質了！

我們将本地的360P畫質視訊進行RTXVSR4檔渲染，從畫面上看，開啟了VSR技術後，右側的渲染視訊确實比左側原生的視訊要清晰許多，并且肉眼可見噪點的減少，觀感上要明顯好于原生的360P視訊。

如果你想知道本地VSR的效果，這裡也有視訊可以看到二者的差距，确實能夠明顯看出有VSR的加持後，不少細節重新清晰可見，對一些低分辨率視訊确實有提升。

左：本地原生360P右：VSR-4檔

總的來說，索泰RTX4090PGFOC上的RTXVSR技術還是相當不錯的，既有不錯的觀感，又有合适的功耗，有了這項全新的技術，将為玩家和視訊觀看者帶來革命性的新體驗！

超頻潛力測試

可以解鎖功耗的RTX4090，那怎麼能少得了超頻呢，索泰RTX4090PGFOC顯示卡，無論是散熱配置還是性能釋放，都是頂級中的頂級。這裡我們将使用索泰的FireStorm控制中心對顯示卡進行超頻，這款軟體不僅能夠用于超頻，還能輕松控制顯示卡BIOS、燈效調節、檢視顯示卡狀态等。

檢視顯示卡資訊

超頻與BIOS切換

風扇轉速調節

在解鎖顯示卡的功耗限制與溫度牆後，我們将GPU核心和GDDR6X顯存同時超頻，在FireStorm中将這款顯示卡的BOOST頻率提升到2725MHz，相比預設狀态拉高了100MHz，此時顯示卡依舊穩定運作，在3DMark的TimeSpy測試中，顯示卡得分39099，比預設狀态好出不少。

我們繼續嘗試，在FireStorm中我們将GPU核心頻率提升50MHz，FireStorm中顯示，這款GPU的Boost頻率已經有2775MHz了。繼續嘗試TimeSpy測試，索泰RTX4090PGFOC順利完成，得分39325分，再度重新整理記錄。并且功耗穩定在480W左右，散熱也維持在良好的水準，核心僅有60℃不到。

最後我們也是嘗試了更高的頻率，成功将索泰RTX4090PGFOC的GPU核心頻率提升了190MHz，顯存頻率提升了1000MHz。在3DMark中這款顯示卡能夠穩定運作在3075MHz下，要知道，這還隻是在風冷狀态下，如果是水冷，那它還能再高一些，此時TimeSpy測試得分39975，僅差一步之遙就可沖上4W大關。并且相比默頻狀态的38122分提高近2000分，超頻潛力可見一斑。

功耗與發熱測試

超強的超頻潛力，緣于索泰RTX4090PGFOC極緻的散熱配置，最後我們就來試試這款顯示卡的散熱性能表現~

在使用Furmark烤機15分鐘後，這款顯示卡的GPU溫度穩定在65.7℃，這樣的成績比起上代的RTX3090Ti可以說是質的飛躍，如果跟其他RTX4090比起來，那也是妥妥的第一梯隊，可見其散熱效率的确非常高。

除了核心，顯示卡内還有個發熱大戶——GDDR6X顯存，不過從實際情況來看，顯然是我多慮了，有了高系數的導熱墊和直觸均熱闆設計後，顯存的溫度僅僅隻比核心高了一點點，66℃的表現，放在前代顯示卡中，那就是鶴立雞群的存在，30系顯示卡看了都是無法企及的高度。

衆所周知，這是一張功耗可以幹到530W的旗艦顯示卡，那實際使用中，會不會功耗爆炸？這裡我們還利用HWINFO64軟體與FrameView軟體雙重記錄多款顯示卡的功耗表現情況，從圖中可以看到索泰RTX4090PGFOC的功耗控制相當出色，測試的多款軟體與遊戲中，功耗都維持在400W附近，功耗表現遠低于上代的RTX3090Ti。

就看這個表現，你就說索泰RTX4090PGFOC牛不牛吧！用更低的功耗實作更強的性能，完全吊打上代卡皇，這才是頂級RTX4090應有的表現。老黃的AdaLovelace架構配合TSMC的4N工藝，40系的功耗比堪稱逆天！

評測總結

測完索泰GeForceRTX4090PGFOC，隻剩一句贊歎“頂級旗艦之是以頂級，是因為在各個方面都做到了頂尖水準”，用這句話形容這張顯示卡一點都不為過。而全新的AdaLovelace架構、TSMC4N制造技術、DLSS3、RTXVSR等黑科技也是悉數登場，給這張頂級的顯示卡又披上了強勁戰甲，讓它的性能達到了前所未有的高度。

在我們的實測過程中，就能感覺到索泰GeForceRTX4090PGFOC的不一般，無論是性能、顔值、還是配置都是當今最強的RTX4090之一。單就遊戲表現來說，它不僅能夠滿足你的4K高刷體驗，甚至8K也有一戰之力。散熱更是一絕，超強的效能造就了極緻的超頻的潛力，不過28相豪華供電也功不可沒，這都是它能夠站在性能頂峰的強勢資本。

再聊聊它的外觀，這回的索泰GeForceRTX4090PGFOC可以說變了也可以說沒變，變的是相比前代的PGF系列，采用了更前衛的設計理念，不變的是繼承了AMP系列的設計風格，圓潤的外觀在這個棱角分明的時代，可謂是賺足了眼球，白色的機身設計更符合時下的潮流，顔值黨看了都直呼過瘾。

總的來說，索泰GeForceRTX4090PGFOC顯示卡既是自家旗下的頂尖之作，也是目前的地表王者。如果你也想感受一下卡皇的威力，那它就是你的最佳選擇。目前索泰GeForceRTX4090PGFOC已經上市，售價16999元，感興趣的話可以去了解一下。

Ada Lovelace架構講解

Turing、Ampere上兩代架構核心均以人物來命名，前者是計算機科學之父——艾倫·麥席森·圖靈；後者則是“電學中的牛頓”——安德烈·瑪麗·安培，電流的國際機關安培就是以其姓氏命名。那AdaLovelace定非凡人，度娘一下果然，這是人稱“數字女王”的阿達·洛芙萊斯，編寫了曆史上首款電腦程式，是被世界公認的第一位計算機程式員，果真是一代比一代還要更牛。PS：她的父親是《唐璜》的作者，詩人拜倫喔。

從Turing架構開始，NVIDIA首次在顯示卡中加入了加速光線追蹤的RTCore單元，以及面向AI推理的TensorCore單元，這革命性的創新使實時光線追蹤成為可能。而Ampere架構則是全面的架構改進，在加入新一代的二代RTCore和三代TensorCore基礎上，還有着更先進的SM單元設計，這樣顯示卡工作效率那是翻倍的提升。而來到AdaLovelace架構，同時是以效率提升為大前提，自然是引入了最新的第三代RTCores與第四代TensorCores單元，同時加入衆多新穎的黑科技，從執行效率來說AdaLovelace架構是上代Ampere架構的2倍以上，甚至光線追蹤能力更是達到了恐怖的4倍性能。

在講述核心架構前，我們先了解幾個關鍵詞：GeForceRTX4090、AdaLovelace、TSMC4N、608mm²、760億個半導體、2倍性能功耗比。

大家帶着幾個關鍵字來看上面的【顯示卡規格參數對比】表格，就可以更容易讀懂上述表格了。最新一代的桌面顯示卡GeForceRTX40系列均采用全新的AdaLovelace架構核心，GeForceRTX4090的核心是AD102，目前AdaLovelace架構核心中最為強大的，具有760億個半導體、16384個CUDA核心和24GB高速美光GDDR6X顯存。

得益于NVIDIA與台積電深度合作的TSMC4N制程工藝，GeForceRTX4090核心面積僅是608mm²（上代RTX3090Ti628mm²），在更小的核心面積下卻能塞下多達760億個半導體，比上一代的Ampere架構多出了約70%半導體數量。

值得注意的是，制程工藝的提升不單能擁有更多的半導體，其核心頻率更是能跑得很高，GeForceRTX4090Boost頻率就已經達到了2520MHz，這樣在核心頻率與高規格的雙向保證下實作了比上代顯示卡高達2倍的性能功耗比。

如果你還是不太懂，這裡筆者就逐一為了AdaLovelace架構顯示卡的構成。

剛才我們已經說到，一個完整的AdaLovelace架構AD102核心内部擁有12個GPC，而每個完整的GPC中包含了一個專用的RasterEngine（光栅化引擎），兩組ROPs共16個ROP（光栅化處理單元），以及6個TPC與12個SM單元。

全新的SM流式多處理器

AdaLovelace架構中最大的亮點之一：全新的SM流式多處理器，每個SM包含了128個CUDA核心、1個第三代的RTCores,4個第四代TensorCores（張量核心）、4個TextureUnits（紋理單元）、256KBRegisterFile（寄存器堆），以及128KBL1資料緩存/共享記憶體子系統，于是這一個全新的SM單元有着超過上一代2倍之的性能表現。

過去的Turing架構INT32計算單元與FP32數量是一緻的，而兩者相加才組成了64個CUDA核心。但是Ampere架構開始，左側的計算單元實作了FP32+INT32的計算單元并發執行，也就是說CUDA核心數量翻倍到了128個。

再來看看AdaLovelace架構的SM，FP32/INT32的計算單元組合，同樣實作了每個SM内含128個CUDA的設計，看似提升不大，但是當你了解到GeForceRTX4090擁有128個SM，16384個CUDA核心，那你也就應該明白達82.6TFLOPS的着色器能力是如何實作的了，比上一代的RTX3090Ti顯示卡的40TFLOPS，還真是提升了兩倍有多。

另外緩存方面AdaLovelace架構也進行了大規格的提升，首先每個SM單元中單獨配上了128KB的緩存，這樣RTX4090顯示卡中就實作了163MBL1/共享記憶體。其次核心的二級緩存進行進行了重新的設計，并且完整AD102核心是96MB二級緩存，而RTX4090顯示卡擁有72MB二級緩存，也可能是是以AdaLovelace架構核心對顯存位寬的依賴性并不高。

技術講解：第三代RT Cores與第四代Tensor Cores

以為剛才的CUDA數量與超大L2緩存就已經很猛了，實作上AdaLovelace架構最大的提升還是在第三代RTCores與第四代TensorCores身上。

第三代RTCores

RTCores用于光線追蹤加速，第三代RTCores的有效光線追蹤計算能力達到191TFLOPS，是上一代産品2.8倍。

在Ampere架構中，第二代RTCores支援邊界交叉測試（BoxIntersectiontesting）和三角形交叉測試（TriangleIntersectiontesting），用于加速BVH周遊和執行射線三角交叉測試計算，雖然光線追蹤處理能力已經比初代的Turing架構核心更高效，但是随着環境和物體的幾何複雜性持續增加，傳統的處理方式很難再以更高效率、正确反應出的現實世界中的光線，尤其是光的運動準确性。

是以在第三代RTCores增加了兩個重要硬體單元：OpacityMicromapEngine與DisplacedMicro-MeshesEngine引擎。OpacityMicromapEngine，主要是用于alpha通道的加速，可以将alpha測試幾何體的光線追蹤速度提高2倍。

在傳統光栅渲染中，開發人員使用一些Alpha通道的素材來實作更高效的畫面渲染，例如Alpha通道的葉子或火焰等複雜形狀的物體。但在光線追蹤時代，這傳統的做法會為光線追蹤帶為不少無效的計算，例如運動性的光線多次通過一塊葉子，光線每擊中一次葉子，都會調用一次着色器來确定如何處理相交，這時就會做成嚴重的執行成本與時間等待成本。

而OpacityMicromapEngine用于直接解析具有非不透明度光線交集的不透明度狀态三角形。根據Alpha通道的不透明，透明與未知等三個不同的塊狀态進行處理：透明則直接忽略繼續找下一個，不透明塊則記錄并告之命中，而未知的則交給着色器來确定如何處理，這樣GPU很大部分都不需要進行着色器的調試處理，能夠實作更為高效的性能。

DisplacedMicro-MeshesEngine

如果說OpacityMicromapEngine加速的是面處理，那麼DisplacedMicro-MeshesEngine就是幾何曲面細節的加速器。如上圖所示，在AdaLovelace架構中，通過1個基底三角形+位移地圖，就可以建立出一個高度詳細的幾何網格，所需要資源占用比二代RTCores更低，效率也更高。

通過NVIDIA給出的建立14:1珊瑚蟹例子來說事，這裡我們需要需要1.7萬個微網格、160萬個微三角形，在AdaLovelace架構中BVH建立速度可加快7.6倍，存儲空間縮小8.1倍。DisplacedMicro-MeshesEngine起到了關鍵性的作用，其将一個幾何物體根據不同細節分成密度不一的微網絡處理，紅色密度超高，細節處理越為複雜。相應的低密度微網絡區域則可以釋放更多的資源與存儲空間，這樣DisplacedMicro-MeshesEngine就可以幫助BVH加速過程，減少建構時間和存儲成本。

同時AdaLovelace架構SM中新增了着色器執行重排序（ShaderExecutionReordering，SER），這是由于光線追蹤不再隻有強光或者陰影渲染處理，未來将會更多的是在光線的運動性，這樣光線就會變得越來越複雜，想要第三代RTCores與第四代TensorCores有着更高的執行效率，那就得為他們來安排一位管家。而着色器執行重排序（SER）就是為了能夠即時重新安排着色器負載來提高執行效率，為光線追蹤提供2倍的加速，也能更好地利用GPU資源。不過目前仍未有執行個體，想實作這個功能，還得遊戲與開發工具的支援才行。

第四代TensorCores

TensorCores是專門為執行張量/矩陣運算而設計的專用執行單元，這些運算是深度學習中使用的核心計算功能。第四代TensorCores新增FP8引擎，具有高達1.32petaflops的張量處理性能，超過上一代的5倍。

技術講解：DLSS 3

或者說第四代TensorCores太硬核你不會知道是啥？提升意義在哪？但是TensorCores最經典的應用DLSS你肯定會知道，這一次AdaLovelace架構支援NVIDIA最新的DLSS3技術。

之前我們也聊過DLSS技術，其設計之初是為了彌補光線追蹤技術後的性能損失，具體的表現為開啟光線追蹤技術後遊戲幀數大幅度的下降，甚至很難保證遊戲流暢的運作。于是DLSS使用低分辨率内容作為輸入并運用AI技術輸出高分辨率幀，進而提升光線追蹤的性能。

在DLSS3中包含了三項技術：DLSS幀生成、DLSS超分辨率（也稱為DLSS2）和NVIDIAReflex。你可以了解為DLSS3是在DLSS2的基礎上，新增了DLSS幀生成技術；而後兩技術中，DLSS超分辨率隻需要GeForceRTX顯示卡都能使用上，NVIDIAReflex則是GeForce900系列以後的顯示卡都用使用上。

想實作DLSS幀生成可不簡單，這需要配合上AdaLovelace架構的GeForceRTX40系列顯示卡才行。DLSS幀生成技術原理是：利用AI技術生成更多幀，以此提升性能。DLSS會借助GeForceRTX40系列GPU所搭載的全新光流加速器分析連續幀和運動資料，進而建立其他高品質幀，同時不會影響圖像品質和響應速度。

從Ampere架構開始，NVIDIA顯示卡就已經支援了光流加速器，而AdaLovelace架構的光流加速器更新到了第二代，其提供了高達300TeraOPS(TOPS)，比安培架構的初代光流加速器（OpticalFlowAcceleration，OFA）快2倍以上。為了實作DLSS幀生成，OFA扮演了重要的角色，其配合上新的運作⽮量分析算法在DLSS3技術架構内實作精确和高性能的幀生成能力。

另外，由于DLSS幀生成是在GPU上作為後處理執行的，那麼即使在遊戲受到CPU性能限制的時候，我們同樣能夠從中獲得更好的遊戲性能提升。尤其是那種實體計算密集型的遊戲或大型場景遊戲，DLSS2均可以讓GeForceRTX40系列顯示卡以高達兩倍于CPU可計算的性能來渲染遊戲。

最後由于DLSS3是建立在DLSS2基礎之上的，遊戲開發者可以在已支援DLSS2或NVIDIAStreamline的現有遊戲中快速內建該功能，是以DLSS3已在遊戲生态得到廣泛應用，目前已有超過35款遊戲和應用即将支援該技術。

閱讀小亮點：NVIDIAReflex

NVIDIAReflex也是DLSS3其中的一環，它可以使GPU和CPU同步，確定最佳響應速度和低系統延遲。

想要實作端對端的最低延遲，你需要確定遊戲、顯示器以及滑鼠三者都同時支援并開啟了Reflex技術。

當GeForceRTX40系列顯示卡和NVIDIAReflex搭配上後，直接達到1440p分辨率360FPS的體驗，這着實是性能有點強勁了。

在GTC2022大會時已經透露将會還有4款1440p分辨率的新型G-SYNC電競顯示器将要釋出，包括采用mini-LED技術的AOCAG274QGM–AGONPROMiniLED、MSIMEG271QMiniLED和ViewSonicXG272G-2KMiniLED三款顯示器重新整理率均為300Hz，而最猛的是ASUSROGSwift360HzPG27AQN，重新整理率直接來到了360Hz。

但唯一一個問題就在于，部分顯示器廠商認為此類産品閱聽人人群較少，會降低此類顯示器的産能，甚至産品就已經被内部PASS掉，是以1440p360Hz是很美好，但現實也是相當的骨感。

技術講解：雙NVIDIA編碼器（NVENC）

GeForceRTX40系列顯示卡還有一個全新的更新，那就是雙編碼器NVENC。第八代的NVENC雙編碼器不僅支援H.264與H.265，還支援開放式視訊編碼格式AV1。

而由于AV1是一種免版稅的視訊編碼格式，上遊軟體廠商與下遊戲的配套端都在大力推廣此編碼格式，我們也會看到越來越多的硬體與軟體支援AV1格式，包括剪映專業版、DaVinciResolve、以及AdobePremierePro較為流行的Voukoder插件均支援，且均可通過編碼預設使用雙編碼器，這樣我們等待視訊導出的時間縮短将近一半。

不單是視訊制作軟體，AV1格式也将會是主播、遊戲直播UP主們的新寵兒，在保證畫面最高品質的情況下，AV1編碼器可将效率提高40%，同時顯示卡的占用也更低。包括OBSStudio一一代軟體中也會增加AV1格式的支援。另外我們還能通過GeForceExperience和OBSStudio錄制高達8K60的内容，這樣我們做遊戲錄制也會變得更為輕松。

包括我們之後測試時使用的遊戲内錄視訊都是支援AV1格式，同時雙編碼器NVENC在資源占用和适配上做得越來越好。