天天看點

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

作者:PConline太平洋科技

前言

試問大家,RTX40系顯示卡中,誰的性能給你震撼一擊?想必不少玩家都會選擇大名鼎鼎的GeForceRTX4090顯示卡。不過這張頂級顯示卡還可以再更新!最近筆者就收到了一張頂尖水準的RTX4090顯示卡,各方面堪稱極緻,甚至突破功耗上限,為的就是給極客玩家帶來更極緻的體驗。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

熟悉索泰的玩家應該知道,索泰一直有個PGF系列,它是索泰顯示卡中最頂級的存在,不過這個系列在RTX40系顯示卡中還沒有誕生新成員。今天它來了!一釋出就是天花闆級别的索泰GeForceRTX4090PGFOC顯示卡,無論是外觀顔值,還是内在用料,它都是當之無愧的非公卡皇,我們也在第一時間上手了這張性能怪獸,下面一起看看它有怎樣的恐怖表現~

下文“索泰GeForceRTX4090PGFOC”簡稱為“索泰RTX4090PGFOC”

規格對比

開始看這張頂級卡皇前,先給它來個詳細的身份識别,這張索泰RTX4090PGFOC用上了AD102-301核心,相比原本的RTX4090,應該是做了一些優化。晶片面積還是熟悉的608mm2,當然啦,也因為用的是TSMC4N工藝,是以小小的核心内塞下了763億個半導體。至于它與公版RTX4090的差別還是在于功耗和頻率的設定上。全新推出的索泰RTX4090PGFOC雖然預設功耗還是450W,但它可以在此基礎上上調17%,也就是說600W不成問題。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

并且BOOST頻率上也有加成,公版的RTX4090為2520MHz,而索泰RTX4090PGFOC的BOOST頻率能夠去到誇張的2625MHz,足足高了有105MHz!再聊聊它的這顆AD102核心,我們也是總結了目前40系顯示卡的所有核心,AD102核心可以稱得上是地表最強的遊戲顯示卡核心了,384bit位寬、144個SM、96MB的L2緩存……,每一項都在告訴你,它就是最Top的存在。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

不過我們從圖上的規格表還是可以發現,目前GeForceRTX4090顯示卡中配備的AD102-300或AD102-301核心其實并非完整的AD102核心。下圖展示的為完整的AD102核心,它應該包括了12個GPC(圖形處理叢集)、72個TPC(紋理處理叢集)、144個SM(流式多處理器)和⼀個帶有12個32Bit顯存控制器的384Bit顯存位寬。這也證明了完整的AD102核心是留給未來可能推出的RTX4090Ti顯示卡的。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

再來看下面的GeForceRTX4090架構圖,和完整版本的AD102核心對比起來就很容易看出差别。首先,GeForceRTX4090核心代号為AD102-300或AD102-301,其擁有9個完整規格的GPC(圖形處理叢集,每個内建6個TPC),與2個非完整的GPC(圖形處理叢集,每個内建5個TPC),共組成了64個TPC,SM單元為128個,相比完整版少了16個。至于顯存位寬老黃還是手下留情了,保留了完整的384Bit。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

外觀賞析:索泰 GeForce RTX 4090 PGF OC

見過不少索泰的顯示卡包裝盒,唯獨索泰RTX4090PGFOC的包裝盒讓我眼前一亮。大面積的線條與圖形使用和這次的PGF系列設計不謀而合,彰顯了“lessismore”的核心主張,給玩家豐富的意象空間。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

拆開包裝盒,索泰RTX4090PGFOC盡顯眼底,不得不說它的外觀設計颠覆了我的想象。過往的PGF系列更多采用黑色色調,外觀上都是硬核機甲風。這回的索泰RTX4090PGFOC可以說是大刀闊斧的改變,圓潤的外殼設計多了許多流線型的柔美,為顯示卡注入了流動與韻律,打破使用尖銳線條勾勒顯示卡外觀的傳統。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

索泰RTX4090PGFOC頂級的不止在它的外觀設計,體積方面也是Top的存在,足足有2.4kg重,這就是一塊有着超強性能的“闆磚”

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

是以為了應對這個重量級的顯示卡,索泰也在包裝盒内附贈了全金屬的顯示卡支架,既美觀又能杜絕顯示卡變形,給予顯示卡有效保護。少不了的還有電源轉接線與RGB線,甚至連說明書都專門做了收納,細節拉滿。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

視角回到顯示卡身上,整張顯示卡以白色為主打色,中間有黑色的緞帶貫穿始終,不過與黑色的風扇恰如其分,黑白撞色設計在視覺效果上既時尚前衛,又帶來了一種沉靜之感與中和之意,靜谧而平衡,同時也暗藏了一絲絲電競硬核風格,設計相當超前。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

細看正面,圓潤的外殼下是三把11cm的巨大散熱風扇,它們采用雙滾珠軸承設計,并且運用了空氣動力學原理,增加了風扇厚度,加深風扇外罩,這有利于風流集中,大幅提升散熱效率。中間的風扇還機智的采用反向旋轉,能夠有效減少亂流、降低噪音。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

每把風扇的扇葉也有小設計,仔細看可以看到每一片扇葉上都有鱗狀仿生條紋,官方稱其為盾鱗2.0高壓扇葉,扇葉的曲率也有改善,這些小改動可以提高風扇的進風量、風壓與風流,讓冷空氣吹透整個散熱鳍片,幫助顯示卡快速降溫。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

顯示卡背面的設計同樣驚豔,首先映入眼簾的就是巨型的”PGF”标志,代表了速度、力量和科技三重含義。旁邊還有專門的PGFLogo信仰燈點綴,與白色的金屬背闆結合,顔值拉滿。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

雖然金屬背闆設計會給顯示卡增重,這是因為索泰增加了合金加強骨骼結構部件,但它有利于鞏固顯示卡、不易變型,而且還可以提升散熱效能,加上背闆末端設有開孔設計,有效加強風扇氣流。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

索泰的顯示卡少不了的就是辨識度,頂部是我們熟悉的ZOTAC信仰Logo與NVIDIA顯示卡特有的GEFORCERTX辨別。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

顯示卡供電用的是全新的12VHPWR供電接口,使用一根12VHPWR的電源線就可達到供電需求。如果你沒有用上最新的電源,還可以使用随機附贈的4x8Pin轉12Pin的電源線轉接使用。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

轉頭看看顯示卡底部,一排排散熱鳍片已經快要突出外殼了,可以預見這款顯示卡的散熱相當出色。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

顯示卡底部還可以看到顯示卡的PCIe金手指,标準的PCIe4.0x16速率,它可以為顯示卡提供更快的傳輸速度。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

視訊輸出接口方面配備了3個DP1.4a和1個HDMI2.1,支援4屏顯示或最高8K@60Hz的超清輸出。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

換個角度,再看看它的厚度,74mm,這已經超越了4槽了,果然高端的顯示卡都有非同尋常的重量。381mm的長度對不少機箱也是一個考驗,ITX機箱基本就不要想着能裝進它了,大機箱才是它的歸宿。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

RGB燈效:索泰 GeForce RTX 4090 PGF OC

高貴冷豔的外觀大家都看過了,那下面就來點不一樣的,相信沒有哪個玩家能夠拒絕RGB的誘惑吧~

顯示卡通電後,頂部的索泰ZOTAC信仰Logo燈率先亮起,多彩的變化加上醒目的設計,辨識度算是拉滿了。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

不過要說這最吸睛的還要看正面的燈帶,在三把散熱風扇的四周,索泰安排了一圈的RGB燈帶,顯示卡點亮時猶如律動的音符,遠望就好像與風扇起舞。在邊緣處更是嵌入了一條綿延不絕的燈帶,光彩動人。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測
不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

索泰可不光在正面安排了RGB,在背部也藏了RGB設計,獨有的PGFLogo信仰燈與頂部的ZOTACLogo信仰燈互相呼應,共同點綴着這張高貴的卡皇。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

每一處角落都不能放過,就連你很少能夠見到的顯示卡側邊也塞下了RGB,支援1600萬色ARGB及多種燈效模式。當你在機箱正面看去,格外靓麗。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測
不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

玩燈那總要可以自定義吧,索泰的FireStorm軟體就內建了這個功能,玩家可以用它自定義RGB,在電源接口的旁邊還有OPENARGB接口,通過附贈的線即可實作整機燈效同步,實作千變萬化的燈效設計,打造專屬于你的靓麗顯示卡。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

純白的外觀配上豔麗的燈光效果,相信不少玩家看完都已經芳心暗許了吧,再來個白色的機箱打造白色主題裝機,又是一件完美的藝術品。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

顯示卡拆解:索泰 GeForce RTX 4090 PGF OC

索泰RTX4090PGFOC雖然看起來很厚實,不過拆解起來還是相當輕松的,傳統的“三明治”結構。卸下金屬背闆上的螺絲後就可以分離整個散熱系統與PCB闆。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

整張顯示卡的PCB闆就突出“進階”二字,黑色的色調加上合理規整的設計,一眼就能看出它出自大廠之手。正面是各式各樣的供電晶片、電感、核心以及顯存,密密麻麻鋪滿了整個PCB闆。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

再看看它的背部,強迫症看了都直呼舒服,并且索泰還在核心背部電容位置使用了四個POSCAP(導電聚合物钽電容)代替四組MLCC(一組10個MLCC),整體電氣性能更強。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

終于輪到我們的主角了,這顆AD102-301-A1核心四平八穩的鑲嵌在PCB的正中央。你以為它隻是小小的一顆晶片,其實它得益于TSMC4N工藝,在裡面塞下了763億個半導體,這個數量足足是RTX3090Ti的2.7倍!

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

核心的周邊則是12顆GDDR6X顯存,來自美光科技,型号為2RU47D8BZC,單顆顯存容量2GB,12顆組成24GB超大顯存。并且這幾顆顯存的速率可是滿血的,顯存速率為21Gbps。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

俯瞰整張PCB,你就可以發現,它的供電規模也堪稱豪華,采用了SEP2.0供電系統。供電總相數來到了誇張的28相,其中24相為核心供電,4相為顯存供電,并且供電內建度相高,每相均采用了固态電容做輸入輸出,還有全封閉電感坐鎮。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

左側PCB供電

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

右側PCB供電

無論是核心供電還是顯存供電,索泰均采用了統一規格的DrMos晶片,可見是下了血本了,晶片來自萬國半導體,封裝型号為BLN0與BLN3,實際應為AOS的AOZ5311NQI與AOZ5311NQI-03,二者持續輸出電流均為55A。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

核心供電DrMos

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

顯存供電DrMos

PWM主要則位于PCB的背部,型号分别是:uP9512R、uP9512U以及uS5650Q。其中uP9512R與uP9512U共同管理核心供電,可以做精細化的供電管理。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

uP9512R

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

uP9512U

而面積最小的uS5650Q則擔任電壓/電流/功耗監控的工作。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

供電規模的強悍還需要有個接入口,索泰RTX4090PGFOC采用了最新的12VHPWR接口,單口供電能力可達600W,帶動這顆“核彈”完全沒有問題。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

不過供電不止12VHPWR接口一處,PCIe也是供電之一,索泰RTX4090PGFOC的PCIe接口為标準的PCIe4.0x16,值得注意的是使用前一定要在主機闆打開ResizableBAR功能,這張顯示卡的性能才能完全釋放。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

當然,上面提及晶片,PCB上還有衆多不可或缺的晶片,例如在核心周圍還能看到兩顆BIOS控制晶片,型号為IS25WP016,分别控制這款顯示卡的預設BIOS與極速BIOS。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

我們繼續拆解它的散熱系統,可以看到索泰RTX4090PGFOC承襲了索泰“堆料王”的品質,一眼就見到了超大面積的VC均熱闆,它能夠迅速吸收GPU産生的熱量,并将熱量迅速均勻傳遞到熱管,讓AD102核心時刻保持冷靜。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

在VC均熱闆的四周是一片又一片定制的高K導熱墊,它們覆寫了顯存、電感、MOS感等發熱大戶,讓其與散熱模組之間無縫連接配接,散熱的同時還能減少嘯叫幾率。中間的核心區域則是厚厚的矽脂,給核心專供,如此高規格的配置,為的就是讓這款頂級顯示卡能夠全力釋放性能。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

不僅僅正面的超大VC均熱闆有散熱,金屬背闆上同樣安排了特設高K導熱墊,配合金屬導熱性強的特性,索泰RTX4090PGFOC的散熱規格足以用恐怖來形容。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

而中間的散熱器才是散熱系統中體積最大的一個,散熱器本體為兩段式散熱子產品,左右兩側均有全覆寫高密度鍍鎳鳍片,搭配全新對流穿透散熱設計,能夠大大提升顯示卡散熱效能。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

散熱鳍片下隐藏着9根冰脈熱管,全部采用精密的無損内嵌焊接工藝,熱管設計也經過全面更新,增加熱管壁厚度和内壁脈絡狀導液溝槽,還用上了更高導熱系數的媒體,為的就是給AD102核心滿血釋放的舞台。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

有了不錯的熱管,還需要風力十足的散熱風扇快速帶離熱量,正面的三個11cm的散熱風扇便是最大的功臣。風扇采用雙滾珠軸承,盾鱗2.0高壓扇葉多達11片,厚度還增加了不少,是以能帶來更強的風壓和風流,實作無死角風流覆寫,配合顯示卡内部散熱部件擁有更加出色的散熱效果。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

最後來個全家福,索泰RTX4090PGFOC的内部構造就像富麗堂皇的皇宮,應有盡有。旗艦級的AD102核心、旗艦級的散熱規格才對得起旗艦PGF的定位。

不惜堆料的旗艦“芯”王,索泰 GeForce RTX 4090 PGF OC顯示卡評測

測試平台介紹

索泰RTX4090PGFOC的裡裡外外大家都見證過了,下面就該真刀真槍的上機測試了。還是編輯部的天花闆配置,CPU用的是最新的IntelCorei9-13900KS,華碩的Z790Hero主機闆搭配2根16GB的金士頓DDR5-6000高頻記憶體。

有了強悍的硬體,顯示裝置也不能拖後腿,顯示器我們采用了愛攻&保時捷聯名PD32M電競顯示器,其搭載了目前頂級的4K144Hz面闆,可以完美體驗到RTX4090帶來的絲滑4K144Hz遊戲體驗。

理論性能測試

國際慣例,跑分前先給這張索泰RTX4090PGFOC顯示卡來個全身體檢,從圖中可以看到這款顯示卡的基準頻率為2235MHz,Boost頻率為2625MHz,遠遠高于公版FE的2520MHz,足足105MHz的提升,這也是它為什麼被索泰稱為旗艦之作的原因之一。

再看看它的功耗與溫度牆限定,不得不說高端顯示卡就是非同凡響,索泰RTX4090PGFOC的預設TGP設定為450W,不過這是普通的RTX4090的極限,不是索泰RTX4090PGFOC的極限,它支援解鎖功耗,最大TGP可至530W,溫度牆也是給到了88℃,看來超頻測試是少不了了。

先看看索泰RTX4090PGFOC的基準性能吧,這裡選用3DMark作為測試工具,從測試結果中可以看出,索泰RTX4090PGFOC對RTX3090Ti就是碾壓,在DX11為基準的FireStrike系列測試中,67806的超高成績比後者高出僅1W多分,性能提升幅度達到了近20%,而在DX12為基準的TimeSpy中,38122的超高分數同樣強過RTX3090Ti的22379分。

不過要說提升最大的就得屬光追與老黃引以為傲的DLSS了,在PortRoyal測試中,索泰RTX4090PGFOC領先RTX3090Ti就有23%以上!而在DLSS方面,這張顯示卡的提升堪稱恐怖,2K下開關DLSS可以有超百幀的差距,更離譜的是8K下,僅開啟DLSS2也能做到60FPS流暢運作。

而在其他理論性能測試中,索泰RTX4090PGFOC更是王者風範,例如在GPGPU理論中,擁有AdaLovalace架構的RTX40系列顯示卡在算力上也有出色的性能表現,尤其是單精度和雙精度浮點運算上,提升幅度是最大的。索泰RTX4090PGFOC整體性能相比RTX3090Ti的性能提升足足有92%左右,不少項目更是2倍甚至3倍的飛躍,着實讓筆者越測越興奮。

遊戲性能測試

再來就是玩家最期待的遊戲性能測試了,想必買這張卡的玩家應該都不缺4K顯示器吧,這裡我們就着重說說它的4K以及8K表現了。不過還是給大家看看它在1080P跟2K的表現,索泰RTX4090PGFOC就是亂殺,大部分遊戲都在200FPS以上,這已經不是入門電競的水準了,而是專業電競的表現。

重點來了~4K分辨率才是這款顯示卡的主戰場,先挑個優化最差的《賽博朋克2077》試試手,可以看到索泰RTX4090PGFOC顯示卡在DLSS2下,遊戲幀數已經有77FPS,你可能覺得不多,那看看隔壁的RTX3090Ti,48FPS的表現真的不夠看,當然你别忘了它還有DLSS3加持,有“大力水手”的加成,幀數還能有不小的飛躍。

8K在以前隻能說是幻想,現在它已經成為了現實!在8K遊戲測試方面,索泰RTX4090PGFOC顯示卡能夠将大部分遊戲跑到60FPS以上,這已經遠遠超乎筆者的想象,而像一些優化好的遊戲,例如《極限競速:地平線5》甚至能有85FPS左右的表現,這還隻是DLSS2的表現,相信加上DLSS3,性能應該更為強悍。

總的來說,索泰RTX4090PGFOC可謂是不負衆望,1080P、2K對它猶如砍瓜切菜般簡單,4K分辨率下,即使隻開DLSS2,依舊有不錯的體驗,如果你玩的遊戲有DLSS3,那體驗更是質的飛躍,至于8K嘛,目前的體驗隻能說良好,基本可玩,後續如果遊戲優化得當,8K電競應該指日可待。

DLSS 3性能實測

提到RTX40系顯示卡就不得不提DLSS3這個黑科技了,它無疑是這代顯示卡更新的重點,相比DLSS2,DLSS3不僅可以實作畫質于幀數的雙向提升,還新增幀生成功能,實作遊戲幀數翻倍,老黃在釋出會上更是直言“DLSS3讓遊戲性能翻倍”!

3DMarkDLSS3理論性能測試

還是老樣子,先驗一下DLSS3的實際理論性能,實測下來有DLSS3的加持下,索泰RTX4090PGFOC顯示卡相比RTX3090Ti實作了性能的翻倍,在4K分辨率下,不開DLSS3僅能勉強維持在60FPS附近,一旦開啟DLSS3後,性能直接提升三倍,180+FPS的驚人表現直接超出RTX3090Ti100多FPS。

8K也是從容不迫,不開啟任何DLSS時,強如RTX4090也隻有13FPS,不過上面我們也看到了索泰RTX4090PGFOC在DLSS2下,8K已經可以跑60FPS了,如果用DLSS3,拿直接逼近百幀!

遊戲實測

光有理論測試,沒有實際遊戲怎麼行,我們這裡就用顯示卡殺手《賽博朋克2077》來“折磨”一下這張頂級卡皇,特别是現在的《賽博朋克2077》還有負載壓力更大的全景光追模式,這又是一項挑戰。

首先我們先看看在超級光追下的表現,DLSS2下,索泰RTX4090PGFOC的表現已經相當不錯了,4K分辨率可以跑到111FPS,這已經能夠滿足4K@120Hz高刷電競了;換到DLSS3我們再測一次,144FPS的表現完美诠釋了它的旗艦定位,再看看2K或1080P,超200+FPS的成績更是唬人。

換裝上壓力更大的全景光追後,我們先在DLSS2下進行體驗,不得不說這個級别的光追壓力确實大,強如索泰RTX4090PGFOC也隻能勉強60FPS運作。至于2K或1080P的表現就會好很多,不過這是一張40系顯示卡,還有DLSS3這個黑科技,在開了DLSS3後,索泰RTX4090PGFOC在4K分辨率下也能有105FPS的出色表現,雖然比超級光追模式下低了一些,不過全景光追的畫面真實度值得你體驗!

另外,眼尖的小夥伴應該也發現了,開啟DLSS3後,遊戲的1%LowFPS均有不同程度的提升,幅度在15-20FPS間浮動,别小看這十幾幀的差距,在遊戲中,1%LowFPS越高,你的遊戲體驗就會更絲滑,遇到卡頓的情況就會減少,這也是DLSS3的一大優勢。

讓我們再看看另一款支援DLSS3的遊戲《F122》,索泰RTX4090PGFOC依舊強勢,在4K畫質下開啟全高特效,有了DLSS3的加成,索泰RTX4090PGFOC能夠跑到163幀,若隻使用DLSS2,則幀數隻有85幀左右,相當于DLSS3這個黑科技給遊戲帶來了50%的遊戲性能提升,相當不錯。

當然了,DLSS3除了能夠有效提升遊戲幀數外,畫質也是一等一的強,這裡我們也截取了DLSS3各個檔位下的遊戲實際畫面,可以看到無論是哪個檔次,遊戲畫質均沒有明顯影響,甚至因為DLSS3是通過AI進行超分渲染,是以在文字等細節紋理上會比原生畫質更加清晰。

DLSS3-F122-DLSS-Balance

DLSS3-F122-DLSS-Perfoemance

DLSS3-F122-DLSS-Quality

DLSS3-F122-DLSS-SuperPerfoemance

DLSS3-F122-TAA

就拿F122内的場景來說,五個不同的檔次,畫質幾乎沒有差別,老黃的DLSS3可以說是把RTX40系顯示卡的遊戲體驗推到了更高的層級,遠遠強于上代的RTX30系顯示卡。

UnrealEngine5LyraDLSS3測試

最後我們還測試了利用UnrealEngine5引擎打造的LyraDEMO,此DEMO除了能夠支援最新的DLSS3技術外,還帶上了NVIDIAReflex。筆者這裡上傳了兩個圖檔給大家看看LyraDEMO裡的DLSS3開啟與關閉的畫質對比,遊戲流暢度自然是DLSS3開啟後提升較為明顯的,達到192FPS,而PCL延遲也進一步降低到了50ms的水準。

Unreal-Engine-5-Lyra-DLSS3-OFF

Unreal-Engine-5-Lyra-DLSS3-ON

更多測試

如果你覺得這些還不夠過瘾,我們也安排了更多遊戲的實測,1080P大家應該不用想也知道,這張卡就是爆殺,這裡給大家展示2K、4K以及8K的成績。

首先是2K分辨率下,開啟DLSS2的索泰RTX4090PGFOC相比起前代卡皇已經大幅領先了,一旦開啟了DLSS3,這張顯示卡仿佛脫缰的野馬!2K下不少遊戲有了300+的幀數表現,看來還是太小看這張索泰RTX4090PGFOC了,4K甚至8K才是它的戰場。

提升分辨率至4K,索泰RTX4090PGFOC終于能夠大展身手了,開關DLSS2與DLSS3,遊戲幀數竟有30-40FPS的差距,這還隻是跟它自己比較。如果你用索泰RTX4090PGFOC與RTX3090Ti相比,那簡直就是降維打擊,超強的性能讓它可以4K@144Hz暢玩3A大作。

視訊内容創作性能測試

遊戲表現可以說是相當的驚豔,那生産力創作上索泰RTX4090PGFOC又有怎樣的驚喜!這裡我們選擇PugetBench、PCMark10、Blender等多款常見的測試軟體,來測試這款顯示卡在日常辦公、視訊内容生産、專業渲染等方面的性能表現。

首先是PCMark10Extended項目,索泰RTX4090PGFOC顯示卡在每個項目上都完成了超越,整體性能領先前代的RTX3090Ti達到了15%左右,不過根據我們前面的測試,領先幅度遠不止于此,畢竟單是遊戲中就是幾十上百幀的差距。

而在視訊内容創作上,索泰RTX4090PGFOC得益于更快的顯存于更強的性能,跑Pugetbench的Pr項目确實比前代卡皇快了很多,有大約30%的性能提升。如果你用達芬奇進行測試,那索泰RTX4090PGFOC的優勢會更加明顯,畢竟AV1編碼是30系顯示卡不曾擁有的技術,後續我們也會對這部分進行更詳細的測試。

專業内容創作性能測試

既然是創作,那除了視訊内容當然還有專業的渲染與工業軟體,在N卡常用的Blender渲染軟體中,索泰RTX4090PGFOC相比RTX3090Ti有97%的性能提升!你沒有聽錯,就是翻倍的性能表現!RTX40系的性能果然不讓人失望。

同樣出色的還有OC渲染器,索泰RTX4090PGFOC的表現真的是頂級的存在,性能也提升了95%以上,想要提升專業性能的使用者不妨考慮一下這張索泰RTX4090PGFOC,頂級的顯示卡頂級的體驗,當然你也将獲得頂級的效率。

像SPEX的專業領域我們也沒有放過,當然我們的索泰RTX4090PGFOC沒有辜負我們的期待,65%的性能提升充滿驚喜。這也得益于全新架構的加持,才讓這款顯示卡能夠實作如此“變态”的性能提升。

NVIDIA雙編碼器測試

上面我們也提到了RTX40系列還藏有一項黑科技可以加速你的視訊内容創作,其實就是它的第八代NVIDIA雙編碼器,它支援時下熱門的AV1編碼,作為下一代主流的視訊編碼技術有着自己獨特的優勢,更快的編碼速度和更高品質的流媒體傳輸性能,讓越來越多的剪輯軟體和視訊網站青睐于它,像我們熟悉的達芬奇、剪映、B站等已經支援AV1編解碼,未來AV1将會成為一個新趨勢。

先看看大家關心的速度,我們選用NVIDIA提供的樣片進行導出測試,有第八代NVENC雙編碼器加持的索泰RTX4090PGFOC确實能帶來更好的性能表現,同樣是H.265視訊輸出,它的效率就要比上代顯示卡快多了;若你是輸出8K30的視訊,這張天花闆級别的RTX4090隻需要46秒就能完成了,相比之下隔壁的RTX3090Ti卻要170秒,幾乎是4倍的效率提升!

另外我們再來看看H.265格式與AV1格式下的畫質差別,從肉眼來看,其實畫質幾乎完全一樣,這樣也意味着AV1可以用更小的空間占用量實作與H.265同等規格的畫質表現,總的來說,無論是導出速度、空間占用還是畫質表現,它都完勝H.265。

AI性能測試

AI是現在這個時代的浪潮,不到一年的時間裡,AI已經席卷了各行各業,各式各樣的AI工具接踵而至。而作為AI時代最大的赢家老黃在GTC上、在COMPUTEX2023上都大談AI,甚至說“現在就是AI的iPhone時刻”,甚至為了讓大家感受AI的魅力,進一步推出了一系列AI産品與服務,震撼全場。

借着這個機會,我們也對索泰RTX4090PGFOC顯示卡進行AI運算能力測試,在使用達芬奇AIACCELERATEDMAGICMASK測試時,同一項目下,架構革新後的索泰RTX4090PGFOC有着更快的渲染時間,原本RTX3090Ti需要幾十秒才能完成的操作,現在僅用17秒!

要說測AI又怎麼能夠少得了生成式AI中最經典的StableDiffusionAI畫圖呢,擁有24GB超大顯存的索泰RTX4090PGFOC顯示卡可以說是這裡的最強王者!選擇NVIDIA提供的描述,生成50張768x768的圖檔,索泰RTX4090PGFOC以1分鐘19張圖的速度一騎絕塵,作為對比,上代的RTX3090Ti則是一分鐘11張圖,可見架構革新确實能夠帶來不小的性能提升,換用新的RTX40系顯示卡也能讓你在AI時代乘風破浪。

RTX VSR測試

AI的能力大家看完了,再給大家看個有意思的。素有視訊版DLSS的RTXVideoSuperResolution視訊超分辨率技術(RTXVSR)終于上線了。在RTX4090上市那會兒,這項技術還沒釋出,現在剛好有索泰RTX4090PGFOC顯示卡,那就用這張顯示卡看看,頂級的性能加上超強的AI技術,究竟能不能将低分辨率的視訊也提升到前所未有的效果。

首先開啟RTXVSR需要你的顯示卡為30系或40系,在NVIDIA控制台中找到視訊圖像設定,手動開啟RTXVideoenhancement即可啟用RTXVSR技術,其中分為1-4檔調節,數字越大品質越好。

實測環節,可以看到在開啟RTXVSR技術之後,原視訊裡的人物線條由原本的模糊不清變得十厘清晰銳利,甚至部分細節已經超越原生1080P了,并且低畫質的視訊也有不少噪點,在開啟VSR4檔後,噪點幾乎消失。

除此之外,由于是AI智能提升分辨率的緣故,字型在原生的480P視訊中有些發虛,甚至字型邊緣可以看到毛邊,不過有了VSR的加持後,字型銳利可見,完全不輸原生1080P的效果,不得不說VSR确實有點東西。

這裡我們也給大家準備了對比視訊,從視訊裡就可以看到VSR的效果之明顯,最進階别的VSR4跟原生480P相比就是一眼的差別,在開啟RTXVSR技術後,部分圖像品質有了顯著提高,不僅鋸齒和噪點幾乎全部消失,顔色過渡也更為平滑,目前VSR能有這種表現堪稱驚豔。

左:原生480P中:VSR4檔右:原生1080P

當然你除了在浏覽器能夠使用這項功能外,本地浏覽器也能享受黑科技的魅力,VLC是目前首個支援RTXVSR技術的本地播放器,且能夠支援多種視訊格式播放,你硬碟裡的老視訊也能擁有清晰畫質了!

我們将本地的360P畫質視訊進行RTXVSR4檔渲染,從畫面上看,開啟了VSR技術後,右側的渲染視訊确實比左側原生的視訊要清晰許多,并且肉眼可見噪點的減少,觀感上要明顯好于原生的360P視訊。

如果你想知道本地VSR的效果,這裡也有視訊可以看到二者的差距,确實能夠明顯看出有VSR的加持後,不少細節重新清晰可見,對一些低分辨率視訊确實有提升。

左:本地原生360P右:VSR-4檔

總的來說,索泰RTX4090PGFOC上的RTXVSR技術還是相當不錯的,既有不錯的觀感,又有合适的功耗,有了這項全新的技術,将為玩家和視訊觀看者帶來革命性的新體驗!

超頻潛力測試

可以解鎖功耗的RTX4090,那怎麼能少得了超頻呢,索泰RTX4090PGFOC顯示卡,無論是散熱配置還是性能釋放,都是頂級中的頂級。這裡我們将使用索泰的FireStorm控制中心對顯示卡進行超頻,這款軟體不僅能夠用于超頻,還能輕松控制顯示卡BIOS、燈效調節、檢視顯示卡狀态等。

檢視顯示卡資訊

超頻與BIOS切換

風扇轉速調節

在解鎖顯示卡的功耗限制與溫度牆後,我們将GPU核心和GDDR6X顯存同時超頻,在FireStorm中将這款顯示卡的BOOST頻率提升到2725MHz,相比預設狀态拉高了100MHz,此時顯示卡依舊穩定運作,在3DMark的TimeSpy測試中,顯示卡得分39099,比預設狀态好出不少。

我們繼續嘗試,在FireStorm中我們将GPU核心頻率提升50MHz,FireStorm中顯示,這款GPU的Boost頻率已經有2775MHz了。繼續嘗試TimeSpy測試,索泰RTX4090PGFOC順利完成,得分39325分,再度重新整理記錄。并且功耗穩定在480W左右,散熱也維持在良好的水準,核心僅有60℃不到。

最後我們也是嘗試了更高的頻率,成功将索泰RTX4090PGFOC的GPU核心頻率提升了190MHz,顯存頻率提升了1000MHz。在3DMark中這款顯示卡能夠穩定運作在3075MHz下,要知道,這還隻是在風冷狀态下,如果是水冷,那它還能再高一些,此時TimeSpy測試得分39975,僅差一步之遙就可沖上4W大關。并且相比默頻狀态的38122分提高近2000分,超頻潛力可見一斑。

功耗與發熱測試

超強的超頻潛力,緣于索泰RTX4090PGFOC極緻的散熱配置,最後我們就來試試這款顯示卡的散熱性能表現~

在使用Furmark烤機15分鐘後,這款顯示卡的GPU溫度穩定在65.7℃,這樣的成績比起上代的RTX3090Ti可以說是質的飛躍,如果跟其他RTX4090比起來,那也是妥妥的第一梯隊,可見其散熱效率的确非常高。

除了核心,顯示卡内還有個發熱大戶——GDDR6X顯存,不過從實際情況來看,顯然是我多慮了,有了高系數的導熱墊和直觸均熱闆設計後,顯存的溫度僅僅隻比核心高了一點點,66℃的表現,放在前代顯示卡中,那就是鶴立雞群的存在,30系顯示卡看了都是無法企及的高度。

衆所周知,這是一張功耗可以幹到530W的旗艦顯示卡,那實際使用中,會不會功耗爆炸?這裡我們還利用HWINFO64軟體與FrameView軟體雙重記錄多款顯示卡的功耗表現情況,從圖中可以看到索泰RTX4090PGFOC的功耗控制相當出色,測試的多款軟體與遊戲中,功耗都維持在400W附近,功耗表現遠低于上代的RTX3090Ti。

就看這個表現,你就說索泰RTX4090PGFOC牛不牛吧!用更低的功耗實作更強的性能,完全吊打上代卡皇,這才是頂級RTX4090應有的表現。老黃的AdaLovelace架構配合TSMC的4N工藝,40系的功耗比堪稱逆天!

評測總結

測完索泰GeForceRTX4090PGFOC,隻剩一句贊歎“頂級旗艦之是以頂級,是因為在各個方面都做到了頂尖水準”,用這句話形容這張顯示卡一點都不為過。而全新的AdaLovelace架構、TSMC4N制造技術、DLSS3、RTXVSR等黑科技也是悉數登場,給這張頂級的顯示卡又披上了強勁戰甲,讓它的性能達到了前所未有的高度。

在我們的實測過程中,就能感覺到索泰GeForceRTX4090PGFOC的不一般,無論是性能、顔值、還是配置都是當今最強的RTX4090之一。單就遊戲表現來說,它不僅能夠滿足你的4K高刷體驗,甚至8K也有一戰之力。散熱更是一絕,超強的效能造就了極緻的超頻的潛力,不過28相豪華供電也功不可沒,這都是它能夠站在性能頂峰的強勢資本。

再聊聊它的外觀,這回的索泰GeForceRTX4090PGFOC可以說變了也可以說沒變,變的是相比前代的PGF系列,采用了更前衛的設計理念,不變的是繼承了AMP系列的設計風格,圓潤的外觀在這個棱角分明的時代,可謂是賺足了眼球,白色的機身設計更符合時下的潮流,顔值黨看了都直呼過瘾。

總的來說,索泰GeForceRTX4090PGFOC顯示卡既是自家旗下的頂尖之作,也是目前的地表王者。如果你也想感受一下卡皇的威力,那它就是你的最佳選擇。目前索泰GeForceRTX4090PGFOC已經上市,售價16999元,感興趣的話可以去了解一下。

Ada Lovelace架構講解

Turing、Ampere上兩代架構核心均以人物來命名,前者是計算機科學之父——艾倫·麥席森·圖靈;後者則是“電學中的牛頓”——安德烈·瑪麗·安培,電流的國際機關安培就是以其姓氏命名。那AdaLovelace定非凡人,度娘一下果然,這是 人稱“數字女王”的阿達·洛芙萊斯,編寫了曆史上首款電腦程式,是被世界公認的第一位計算機程式員,果真是一代比一代還要更牛。PS:她的父親是《唐璜》的作者,詩人拜倫喔。

從Turing架構開始,NVIDIA首次在顯示卡中加入了加速光線追蹤的RTCore單元,以及面向AI推理的TensorCore單元,這革命性的創新使實時光線追蹤成為可能。而Ampere架構則是全面的架構改進,在加入新一代的二代RTCore和三代TensorCore基礎上,還有着更先進的SM單元設計,這樣顯示卡工作效率那是翻倍的提升。而來到AdaLovelace架構,同時是以效率提升為大前提,自然是引入了最新的第三代RTCores與第四代TensorCores單元,同時加入衆多新穎的黑科技,從執行效率來說AdaLovelace架構是上代Ampere架構的2倍以上,甚至光線追蹤能力更是達到了恐怖的4倍性能。

在講述核心架構前,我們先了解幾個關鍵詞:GeForceRTX4090、AdaLovelace、TSMC4N、608mm²、760億個半導體、2倍性能功耗比。

大家帶着幾個關鍵字來看上面的【顯示卡規格參數對比】表格,就可以更容易讀懂上述表格了。最新一代的桌面顯示卡GeForceRTX40系列均采用全新的AdaLovelace架構核心,GeForceRTX4090的核心是AD102,目前AdaLovelace架構核心中最為強大的,具有760億個半導體、16384個CUDA核心和24GB高速美光GDDR6X顯存。

得益于NVIDIA與台積電深度合作的TSMC4N制程工藝,GeForceRTX4090核心面積僅是608mm²(上代RTX3090Ti628mm²),在更小的核心面積下卻能塞下多達760億個半導體,比上一代的Ampere架構多出了約70%半導體數量。

值得注意的是,制程工藝的提升不單能擁有更多的半導體,其核心頻率更是能跑得很高,GeForceRTX4090Boost頻率就已經達到了2520MHz,這樣在核心頻率與高規格的雙向保證下實作了比上代顯示卡高達2倍的性能功耗比。

如果你還是不太懂,這裡筆者就逐一為了AdaLovelace架構顯示卡的構成。

剛才我們已經說到,一個完整的AdaLovelace架構AD102核心内部擁有12個GPC,而每個完整的GPC中包含了一個專用的RasterEngine(光栅化引擎),兩組ROPs共16個ROP(光栅化處理單元),以及6個TPC與12個SM單元。

全新的SM流式多處理器

AdaLovelace架構中最大的亮點之一:全新的SM流式多處理器,每個SM包含了128個CUDA核心、1個第三代的RTCores,4個第四代TensorCores(張量核心)、4個TextureUnits(紋理單元)、256KBRegisterFile(寄存器堆),以及128KBL1資料緩存/共享記憶體子系統,于是這一個全新的SM單元有着超過上一代2倍之的性能表現。

過去的Turing架構INT32計算單元與FP32數量是一緻的,而兩者相加才組成了64個CUDA核心。但是Ampere架構開始,左側的計算單元實作了FP32+INT32的計算單元并發執行,也就是說CUDA核心數量翻倍到了128個。

再來看看AdaLovelace架構的SM,FP32/INT32的計算單元組合,同樣實作了每個SM内含128個CUDA的設計,看似提升不大,但是當你了解到GeForceRTX4090擁有128個SM,16384個CUDA核心,那你也就應該明白達82.6TFLOPS的着色器能力是如何實作的了,比上一代的RTX3090Ti顯示卡的40TFLOPS,還真是提升了兩倍有多。

另外緩存方面AdaLovelace架構也進行了大規格的提升,首先每個SM單元中單獨配上了128KB的緩存,這樣RTX4090顯示卡中就實作了163MBL1/共享記憶體。其次核心的二級緩存進行進行了重新的設計,并且完整AD102核心是96MB二級緩存,而RTX4090顯示卡擁有72MB二級緩存,也可能是是以AdaLovelace架構核心對顯存位寬的依賴性并不高。

技術講解:第三代RT Cores與第四代Tensor Cores

以為剛才的CUDA數量與超大L2緩存就已經很猛了,實作上AdaLovelace架構最大的提升還是在第三代RTCores與第四代TensorCores身上。

第三代RTCores

RTCores用于光線追蹤加速,第三代RTCores的有效光線追蹤計算能力達到191TFLOPS,是上一代産品2.8倍。

在Ampere架構中,第二代RTCores支援邊界交叉測試(BoxIntersectiontesting)和三角形交叉測試(TriangleIntersectiontesting),用于加速BVH周遊和執行射線三角交叉測試計算,雖然光線追蹤處理能力已經比初代的Turing架構核心更高效,但是随着環境和物體的幾何複雜性持續增加,傳統的處理方式很難再以更高效率、正确反應出的現實世界中的光線,尤其是光的運動準确性。

是以在第三代RTCores增加了兩個重要硬體單元:OpacityMicromapEngine與DisplacedMicro-MeshesEngine引擎。OpacityMicromapEngine,主要是用于alpha通道的加速,可以将alpha測試幾何體的光線追蹤速度提高2倍。

在傳統光栅渲染中,開發人員使用一些Alpha通道的素材來實作更高效的畫面渲染,例如Alpha通道的葉子或火焰等複雜形狀的物體。但在光線追蹤時代,這傳統的做法會為光線追蹤帶為不少無效的計算,例如運動性的光線多次通過一塊葉子,光線每擊中一次葉子,都會調用一次着色器來确定如何處理相交,這時就會做成嚴重的執行成本與時間等待成本。

而OpacityMicromapEngine用于直接解析具有非不透明度光線交集的不透明度狀态三角形。根據Alpha通道的不透明,透明與未知等三個不同的塊狀态進行處理:透明則直接忽略繼續找下一個,不透明塊則記錄并告之命中,而未知的則交給着色器來确定如何處理,這樣GPU很大部分都不需要進行着色器的調試處理,能夠實作更為高效的性能。

DisplacedMicro-MeshesEngine

如果說OpacityMicromapEngine加速的是面處理,那麼DisplacedMicro-MeshesEngine就是幾何曲面細節的加速器。如上圖所示,在AdaLovelace架構中,通過1個基底三角形+位移地圖,就可以建立出一個高度詳細的幾何網格,所需要資源占用比二代RTCores更低,效率也更高。

通過NVIDIA給出的建立14:1珊瑚蟹例子來說事,這裡我們需要需要1.7萬個微網格、160萬個微三角形,在AdaLovelace架構中BVH建立速度可加快7.6倍,存儲空間縮小8.1倍。DisplacedMicro-MeshesEngine起到了關鍵性的作用,其将一個幾何物體根據不同細節分成密度不一的微網絡處理,紅色密度超高,細節處理越為複雜。相應的低密度微網絡區域則可以釋放更多的資源與存儲空間,這樣DisplacedMicro-MeshesEngine就可以幫助BVH加速過程,減少建構時間和存儲成本。

同時AdaLovelace架構SM中新增了着色器執行重排序(ShaderExecutionReordering,SER),這是由于光線追蹤不再隻有強光或者陰影渲染處理,未來将會更多的是在光線的運動性,這樣光線就會變得越來越複雜,想要第三代RTCores與第四代TensorCores有着更高的執行效率,那就得為他們來安排一位管家。而着色器執行重排序(SER)就是為了能夠即時重新安排着色器負載來提高執行效率,為光線追蹤提供2倍的加速,也能更好地利用GPU資源。不過目前仍未有執行個體,想實作這個功能,還得遊戲與開發工具的支援才行。

第四代TensorCores

TensorCores是專門為執行張量/矩陣運算而設計的專用執行單元,這些運算是深度學習中使用的核心計算功能。第四代TensorCores新增FP8引擎,具有高達1.32petaflops的張量處理性能,超過上一代的5倍。

技術講解:DLSS 3

或者說第四代TensorCores太硬核你不會知道是啥?提升意義在哪?但是TensorCores最經典的應用DLSS你肯定會知道,這一次AdaLovelace架構支援NVIDIA最新的DLSS3技術。

之前我們也聊過DLSS技術,其設計之初是為了彌補光線追蹤技術後的性能損失,具體的表現為開啟光線追蹤技術後遊戲幀數大幅度的下降,甚至很難保證遊戲流暢的運作。于是DLSS使用低分辨率内容作為輸入并運用AI技術輸出高分辨率幀,進而提升光線追蹤的性能。

在DLSS3中包含了三項技術:DLSS幀生成、DLSS超分辨率(也稱為DLSS2)和NVIDIAReflex。你可以了解為DLSS3是在DLSS2的基礎上,新增了DLSS幀生成技術;而後兩技術中,DLSS超分辨率隻需要GeForceRTX顯示卡都能使用上,NVIDIAReflex則是GeForce900系列以後的顯示卡都用使用上。

想實作DLSS幀生成可不簡單,這需要配合上AdaLovelace架構的GeForceRTX40系列顯示卡才行。DLSS幀生成技術原理是:利用AI技術生成更多幀,以此提升性能。DLSS會借助GeForceRTX40系列GPU所搭載的全新光流加速器分析連續幀和運動資料,進而建立其他高品質幀,同時不會影響圖像品質和響應速度。

從Ampere架構開始,NVIDIA顯示卡就已經支援了光流加速器,而AdaLovelace架構的光流加速器更新到了第二代,其提供了高達300TeraOPS(TOPS),比安培架構的初代光流加速器(OpticalFlowAcceleration,OFA)快2倍以上。為了實作DLSS幀生成,OFA扮演了重要的角色,其配合上新的運作⽮量分析算法在DLSS3技術架構内實作精确和高性能的幀生成能力。

另外,由于DLSS幀生成是在GPU上作為後處理執行的,那麼即使在遊戲受到CPU性能限制的時候,我們同樣能夠從中獲得更好的遊戲性能提升。尤其是那種實體計算密集型的遊戲或大型場景遊戲,DLSS2均可以讓GeForceRTX40系列顯示卡以高達兩倍于CPU可計算的性能來渲染遊戲。

最後由于DLSS3是建立在DLSS2基礎之上的,遊戲開發者可以在已支援DLSS2或NVIDIAStreamline的現有遊戲中快速內建該功能,是以DLSS3已在遊戲生态得到廣泛應用,目前已有超過35款遊戲和應用即将支援該技術。

閱讀小亮點:NVIDIAReflex

NVIDIAReflex也是DLSS3其中的一環,它可以使GPU和CPU同步,確定最佳響應速度和低系統延遲。

想要實作端對端的最低延遲,你需要確定遊戲、顯示器以及滑鼠三者都同時支援并開啟了Reflex技術。

當GeForceRTX40系列顯示卡和NVIDIAReflex搭配上後,直接達到1440p分辨率360FPS的體驗,這着實是性能有點強勁了。

在GTC2022大會時已經透露将會還有4款1440p分辨率的新型G-SYNC電競顯示器将要釋出,包括采用mini-LED技術的AOCAG274QGM–AGONPROMiniLED、MSIMEG271QMiniLED和ViewSonicXG272G-2KMiniLED三款顯示器重新整理率均為300Hz,而最猛的是ASUSROGSwift360HzPG27AQN,重新整理率直接來到了360Hz。

但唯一一個問題就在于,部分顯示器廠商認為此類産品閱聽人人群較少,會降低此類顯示器的産能,甚至産品就已經被内部PASS掉,是以1440p360Hz是很美好,但現實也是相當的骨感。

技術講解:雙NVIDIA編碼器(NVENC)

GeForceRTX40系列顯示卡還有一個全新的更新,那就是雙編碼器NVENC。第八代的NVENC雙編碼器不僅支援H.264與H.265,還支援開放式視訊編碼格式AV1。

而由于AV1是一種免版稅的視訊編碼格式,上遊軟體廠商與下遊戲的配套端都在大力推廣此編碼格式,我們也會看到越來越多的硬體與軟體支援AV1格式,包括剪映專業版、DaVinciResolve、以及AdobePremierePro較為流行的Voukoder插件均支援,且均可通過編碼預設使用雙編碼器,這樣我們等待視訊導出的時間縮短将近一半。

不單是視訊制作軟體,AV1格式也将會是主播、遊戲直播UP主們的新寵兒,在保證畫面最高品質的情況下,AV1編碼器可将效率提高40%,同時顯示卡的占用也更低。包括OBSStudio一一代軟體中也會增加AV1格式的支援。另外我們還能通過GeForceExperience和OBSStudio錄制高達8K60的内容,這樣我們做遊戲錄制也會變得更為輕松。

包括我們之後測試時使用的遊戲内錄視訊都是支援AV1格式,同時雙編碼器NVENC在資源占用和适配上做得越來越好。