360mm液冷榨干GPU性能 七彩虹RTX 4090水神評(píng)測(cè)
就在昨天,NVIDIA正式對(duì)自家的RTX 4090顯卡性能進(jìn)行了解禁,我們也是第一時(shí)間發(fā)布了《4倍3090Ti性能所言不虛?RTX 4090顯卡游民首測(cè)》一文,相信大家對(duì)于RTX 4090顯卡的技術(shù)特點(diǎn)已經(jīng)有一個(gè)比較直觀的認(rèn)識(shí)了吧。

但是,昨天解禁的畢竟是公版性能,意味著整個(gè)RTX 4090系列里邊最基礎(chǔ)的性能表現(xiàn)。那么作為頻率高于公版的OC版顯卡,它的性能又會(huì)如何?與上代旗艦RTX 3090 Ti以及友商旗艦RX 6950 XT相比,又有多大的性能區(qū)別?

我們也是收到了來(lái)自七彩虹的iGame GeForce RTX 4090 Neptune OC(下簡(jiǎn)稱iGame RTX 4090水神)顯卡,在非公版的解禁的第一時(shí)間,我們找了10款自帶Benchmark的光追游戲來(lái)給大家?guī)?lái)直觀的性能測(cè)試。
本次測(cè)試會(huì)以開(kāi)光追+DLSS和開(kāi)光追關(guān)閉DLSS進(jìn)行對(duì)比,不過(guò)由于友商RX 6950XT并不支持DLSS技術(shù),所以僅參與開(kāi)光追關(guān)閉DLSS測(cè)試。這幾款顯卡之間的性能又會(huì)有多大的區(qū)別?就讓我們一起來(lái)看下吧!
產(chǎn)品架構(gòu)解析:

按照慣例我們還是先上產(chǎn)品相關(guān)型號(hào)對(duì)比表,以便大家對(duì)這款顯卡和上代旗艦RTX 3090 Ti以及對(duì)位產(chǎn)品(AD102-300對(duì)GA102-300)RTX 3090的參數(shù)方面有一個(gè)直觀的了解。
值得一提的是,RTX 3090 Ti的L1緩存為10.5MB,L2緩存為6MB。RTX 4090的L1緩存則是16MB,L2緩存則是72MB。不僅是L1緩存提升了一半以上,在L2緩存方面,RTX 4090也比上一代旗艦整整翻了16倍。
此外,除了工藝制程帶來(lái)的晶體管增多之外,在技術(shù)方面,RTX 4090使用了第四代Tensor核心和第三代RT核心,都較RTX 30系列顯卡提升了一個(gè)檔次。

本次測(cè)試主角七彩虹RTX 4090水神OC顯卡與上代旗艦RTX 3090 Ti和友商旗艦的GPU-Z對(duì)比。

在核心架構(gòu)方面,本次的Ada架構(gòu)完整核心擁有12個(gè)GPC單元,每個(gè)GPC單元中最多包含6個(gè)TPC以及12條SM簇。合計(jì)144條SM簇。
而RTX 4090僅啟用了11個(gè)GPC單元,且其中的2個(gè)GPC單元僅各啟用了5個(gè)TPC和10條SM簇。合計(jì)128條SM簇。
由于每條SM簇中含有128個(gè)流處理器,所以RTX 4090距離完整的Ada核心還有16條SM簇/2048個(gè)流處理器的差距。
當(dāng)然,完整的Ada架構(gòu)擁有18MB的L1緩存,以及96MB的L2緩存(對(duì)比RTX 4090 L1 16MB,L2 72MB)。

在SM簇的架構(gòu)方面,全新的Ada架構(gòu)和上一代的Ampere架構(gòu)并沒(méi)有太大區(qū)別,每一個(gè)SM簇里邊擁有4*32個(gè)FP32單元(流處理器),而每一組中的一半單元同時(shí)可以處理INT32指令,且包含了1個(gè)Tensor核心。而1個(gè)SM簇里邊同時(shí)包含了1個(gè)RT核心。
所以,RTX 4090的參數(shù)計(jì)算方式應(yīng)為:
9(GPC)*12(SM簇)+2(GPC)*10(SM簇)=108+20=128(SM簇)
128(SM簇)*128(流處理器)=16384(流處理器)
128(SM簇)*4(Tensor核心)=512(Tensor核心)
128(SM簇)*1(RT核心)=128(RT核心)
12(顯存控制器)*32bit(位寬)=384bit(位寬)
七彩虹RTX 4090水神冷排:

七彩虹的iGame GeForce RTX 4090 Neptune OC,中文簡(jiǎn)稱水神
和上一代RTX 30系列水神不同的,這次七彩虹采用了白色的散熱冷排和冷水管,且冷排規(guī)格升級(jí)為360mm,風(fēng)扇控制線材包含在了冷水管內(nèi),使得接線變得更加的方便。
另外水神顯卡本體的外殼外觀也經(jīng)過(guò)了重新設(shè)計(jì),無(wú)論是iGame LOGO,還是2條燈帶或銀色的外觀,顏值方面可謂直接拉滿。當(dāng)然,這就要求機(jī)箱至少有一個(gè)可以容納360mm冷排的位置。
為了保證更好的散熱性能,RTX 4090水神采用了標(biāo)準(zhǔn)的360規(guī)格冷排,上邊使用了3個(gè)12025規(guī)格的風(fēng)扇。

該冷排采用了標(biāo)準(zhǔn)的12水道設(shè)計(jì)。

在風(fēng)扇方面,iGame RTX 4090 水神的12025規(guī)格風(fēng)扇除了支持ARGB之外,扇葉也有點(diǎn)類似于安耐美的“火蝠”系列風(fēng)扇的設(shè)計(jì)蝠翼設(shè)計(jì)。這樣的設(shè)計(jì)可以更好降低風(fēng)扇轉(zhuǎn)動(dòng)時(shí)風(fēng)切產(chǎn)生的噪音,并起到增強(qiáng)風(fēng)壓的效果。

3個(gè)風(fēng)扇通過(guò)串聯(lián)加直連的形式最終接在冷排上邊的HUB上。該HUB共支持3個(gè)風(fēng)扇的PWM統(tǒng)一調(diào)控和1個(gè)ARGB的燈光統(tǒng)一調(diào)控。

在冷排的側(cè)面可以看到BREAK THE DIMENSIONAL WALL(打破次元壁)的英文標(biāo)識(shí),而在冷排的兩端可以看到iGame的標(biāo)志。
iGame RTX 4090水神本體:

不同于早先RTX 30系黑色加大眼睛的造型,iGame RTX 4090水神采用了銀色的外觀,且在造型方面盡可能的簡(jiǎn)約、時(shí)尚。

在左下角的iGame的英文表示,右上角則印有NEPTUNE的英文標(biāo)識(shí)??ㄉ竦膬蓷l波浪線則會(huì)根據(jù)顯卡運(yùn)行亮起RGB燈光。

顯卡肩部,左邊是RGB燈光區(qū)域,內(nèi)部可以看到iGame的英文標(biāo)識(shí)以及2個(gè)箭頭。中間則是GEFORCE RTX的英文標(biāo)識(shí)。右邊則是顯卡接口處。
該顯卡采用12+4Pin的12VHPWR供電方式,隨顯卡附送了一根12+4Pin轉(zhuǎn)4*8Pin的轉(zhuǎn)接線,用戶可根據(jù)電源選擇直接連接12+4Pin或是通過(guò)轉(zhuǎn)接線進(jìn)行轉(zhuǎn)接。
旁邊的接口則是燈光同步接口,可以通過(guò)顯卡附贈(zèng)的燈光同步線纜與其它品牌主板燈光同步。

背面,為了增加顯卡的堅(jiān)固性,七彩虹的水神在背面增加了一個(gè)鋁合金背板。同時(shí)上邊印有GEFORCE RTX的英文字樣和iGame以及水神的標(biāo)志。
值得一提的是該背板下邊并沒(méi)有導(dǎo)熱硅脂墊,所以僅起到加固和保護(hù)顯卡的作用。

而在輸出接口方面,該顯卡采用了3個(gè)DP1.4a加1個(gè)HDMI2.1的組合方案。同時(shí),左上角的案件則是七彩虹特有的一鍵超頻鍵。
按下后可進(jìn)入的超頻版BIOS,此時(shí)GPU Boost頻率為2640MHz,彈出則是公版頻率,此時(shí)GPU Boost頻率為2520MHz,BIOS的切換需要重啟完成。
iGame RTX 4090水神拆解:

這次的拆解可以說(shuō)是我目前見(jiàn)過(guò)覆蓋最全的拆解了,iGame RTX 4090水神顯卡的本體分為水泵+銅模塊,PCB模塊以及背板模塊。
水泵+銅板模塊上可以看到密密麻麻的導(dǎo)熱硅脂墊。除了顯存特有的高性能導(dǎo)熱墊之外,在電容、電感以及DrMos也全覆蓋的添加了高性能導(dǎo)熱墊。有別于普通的導(dǎo)熱墊,高性能導(dǎo)熱墊非常容易與電子元器件產(chǎn)生貼合,所以僅這一地方的拆解難度就變得非常高。

有別于公版的開(kāi)衩造型,iGame RTX 4090水神的PCB要板正的多,僅PCB方面的長(zhǎng)為230mm,高則是135mm(含金手指)。
該顯卡采用了24+4相供電設(shè)計(jì),每項(xiàng)配有一個(gè)iGame RTX 4090水神特有的I.P.P(iGame Pure Power)至純供電電感構(gòu)成,其中核心為24相,顯存則是4相。不過(guò)該卡的DrMos采用了2種規(guī)格錯(cuò)落排列。在PWM芯片方面,該顯卡由一個(gè)uP9512U+uP9512R構(gòu)成了核心供電系統(tǒng),uS5650Q則是負(fù)責(zé)顯存供電。

顯卡的顯存采用了鎂光的D8BCZ系列,該顯存顆粒為GDDR6X顯存,單顆容量為2GB,圍繞在GPU的左右個(gè)4顆+上3下1(合計(jì)4顆)構(gòu)成了12*2=24GB的顯存容量。該顯存的頻率為1313MHz,等效顯存速率則是21Gbps。

最后,RTX 4090所使用的AD102-300核心。值得一提的是,RTX 3090 Ti使用的是AP102-350核心,RTX 3090使用的是AP102-300核心。
測(cè)試平臺(tái)及測(cè)試項(xiàng)目介紹:

本次測(cè)試我們選擇了Intel目前的旗艦級(jí)處理器酷睿i9-12900K。內(nèi)存盡可能拔高,采用了芝奇的DDR5-6600 C34 16GB*2組合。同時(shí),為了保證不被系統(tǒng)影響,我們選擇了之前的21H2版Windows 11操作系統(tǒng)。顯卡驅(qū)動(dòng)則是512.90。

而在測(cè)試項(xiàng)目方面,除了標(biāo)準(zhǔn)的3DMark測(cè)試項(xiàng)目之外,我們還加入了DLSS以及光追性能測(cè)試。
游戲測(cè)試方面,我們選擇了10款自帶Benchmark的光追游戲,如果有DLSS開(kāi)啟和關(guān)閉選項(xiàng)時(shí),我們還對(duì)開(kāi)啟質(zhì)量檔和關(guān)閉狀態(tài)下先進(jìn)性了對(duì)比測(cè)試。

↑整體測(cè)試平臺(tái)

本次測(cè)試使用的內(nèi)存是來(lái)自芝奇的F5-6600J3440G16X2-TZ5RS,該內(nèi)存共計(jì)兩條,每條容量為16GB,擁有DDR5-6600MHz的頻率以及CL34-40-40-105的時(shí)序,其電壓為1.4V。通過(guò)雙通道模式可以給電腦帶來(lái)更加強(qiáng)勁的性能。不過(guò),由于Intel的內(nèi)存控制器原因,所以這套內(nèi)存僅工作在Gear2模式。

測(cè)試使用的系統(tǒng)盤是來(lái)自金士頓的NV2 PCIe 4.0 NVMe M.2系列,該固態(tài)硬盤的容量為2TB,支持PCIe 4.0 X4通道,這是一款高性價(jià)比的,親民價(jià)位固態(tài)硬盤。其硬盤的連續(xù)讀取速度為3500MB/s,連續(xù)寫入速度為2800MB/s。硬盤的讀寫壽命高達(dá)640TBW。該影片的質(zhì)保年限為3年。

測(cè)試使用的處理器為Intel目前的旗艦級(jí)產(chǎn)品酷睿i9-12900K,為了讓處理器保持較低的溫度可以充分發(fā)揮顯卡的性能,我們特別選擇了來(lái)自利民的Frozen MAGIC 360 SCENIC V2這款高性能純白360一體式水冷散熱器。該散熱器使用了3個(gè)高性能的TL-B12W風(fēng)扇,加上0.1mm的微水道設(shè)計(jì)銅底以及5300轉(zhuǎn)高轉(zhuǎn)速水泵,可以更好、更迅速的為處理器進(jìn)行降溫,以保證系統(tǒng)能夠穩(wěn)定運(yùn)行。同時(shí)該水冷5年質(zhì)保。

最后,在電源方面,由于本次測(cè)試涉及RTX 4090水神這款功耗超過(guò)600W的顯卡,以及RTX 3090 Ti和RX 6950XT這類高性能顯卡的關(guān)系,為了使整體平臺(tái)運(yùn)行更加的穩(wěn)定,我們特別選擇了海韻的Prime TX-1600這款額定1600W的80PLUS鈦金全模組旗艦電源,該電源支持單路12V輸出,電流可達(dá)133.3A,能夠?yàn)橄到y(tǒng)提供更加純凈,充足的供電性能。
3DMark基準(zhǔn)性能測(cè)試:

↑《3DMark》DLSS測(cè)試結(jié)果對(duì)比

↑《3DMark》Port Royal光追性能測(cè)試結(jié)果對(duì)比

↑《3DMark》Time Spy Extreme DX12,4K顯卡得分對(duì)比

↑《3DMark》Time Spy DX12,2K顯卡得分對(duì)比

↑《3DMark》Fire Strike Ultra DX11,4K顯卡得分對(duì)比

↑《3DMark》Fire Strike Extreme DX11,2K顯卡得分對(duì)比

↑《3DMark》Fire Strike DX11,1080P顯卡得分對(duì)比
《賽博朋克2077》、《古墓麗影:暗影》游戲性能對(duì)比:

↑《賽博朋克2077》4K分辨率游戲性能對(duì)比

↑《賽博朋克2077》2K分辨率游戲性能對(duì)比

↑《賽博朋克2077》1080P分辨率游戲性能對(duì)比

↑《古墓麗影:暗影》4K分辨率游戲性能對(duì)比

↑《古墓麗影:暗影》2K分辨率游戲性能對(duì)比

↑《古墓麗影:暗影》1080P分辨率游戲性能對(duì)比
《光明記憶:無(wú)限》、《邊境》性能對(duì)比:

↑《光明記憶:無(wú)限》Benchmark 4K分辨率性能對(duì)比

↑《光明記憶:無(wú)限》Benchmark 1080P分辨率性能對(duì)比

↑《光明記憶:無(wú)限》Benchmark 2K分辨率性能對(duì)比

↑《邊境》Benchmark 4K分辨率性能對(duì)比

↑《邊境》Benchmark 2K分辨率性能對(duì)比

↑《邊境》Benchmark 1080P分辨率性能對(duì)比
《德軍總部:新血脈》、《看門狗:軍團(tuán)》游戲性能對(duì)比:

↑《德軍總部:新血脈》4K分辨率游戲性能對(duì)比

↑《德軍總部:新血脈》2K分辨率游戲性能對(duì)比

↑《德軍總部:新血脈》1080P分辨率游戲性能對(duì)比

↑《看門狗:軍團(tuán)》4K分辨率游戲性能對(duì)比

↑《看門狗:軍團(tuán)》2K分辨率游戲性能對(duì)比

↑《看門狗:軍團(tuán)》1080P分辨率游戲性能對(duì)比
《殺手3》、《F1 22》游戲性能對(duì)比:

↑《殺手3》4K分辨率游戲性能對(duì)比

↑《殺手3》2K分辨率游戲性能對(duì)比

↑《殺手3》1080P分辨率游戲性能對(duì)比

↑《F1 22》4K分辨率游戲性能對(duì)比

↑《F1 22》2K分辨率游戲性能對(duì)比

↑《F1 22》1080P分辨率游戲性能對(duì)比
《孤島驚魂6》、《神隕》游戲性能對(duì)比:

↑《孤島驚魂6》4K分辨率游戲性能對(duì)比

↑《孤島驚魂6》2K分辨率游戲性能對(duì)比

↑《孤島驚魂6》1080P分辨率游戲性能對(duì)比

↑《神隕》4K分辨率游戲性能對(duì)比

↑《神隕》2K分辨率游戲性能對(duì)比

↑《神隕》1080P分辨率游戲性能對(duì)比
DLSS 3.0游戲性能測(cè)試:
因?yàn)镈LSS 3.0目前需要特殊方法進(jìn)入進(jìn)行測(cè)試,所以我們有別于正常游戲,選擇了3款游戲進(jìn)行了單獨(dú)的測(cè)試。且鑒于目前DLSS 3.0僅支持RTX 4090顯卡,所以本次測(cè)試并無(wú)加入其它顯卡的對(duì)比。

↑《逆水寒》DLSS 3.0 4K分辨率性能測(cè)試

↑《逆水寒》DLSS 3.0 2K分辨率性能測(cè)試
無(wú)論2K還是4K分辨率,性能提升可以用“劇烈”來(lái)形容,從原來(lái)幾乎不能玩變成絲滑暢爽。

↑《F1 22》DLSS 3.0 4K分辨率性能測(cè)試

↑《F1 22》DLSS 3.0 2K分辨率性能測(cè)試
2K分辨率下本身幀率已經(jīng)很高,DLSS3質(zhì)量模式提升明顯,但性能模式進(jìn)步不大,可能建模速率已到CPU性能上限,4K測(cè)試似乎佐證了這一點(diǎn)。

↑《瘟疫傳說(shuō):安魂曲》DLSS 3.0 4K分辨率性能測(cè)試

↑《瘟疫傳說(shuō):安魂曲》DLSS 3.0 2K分辨率性能測(cè)試
《瘟疫傳說(shuō):安魂曲》打開(kāi)DLSS3后性能也是爆炸式的提升,僅質(zhì)量模式就幾乎達(dá)到兩倍。
工況測(cè)試及總結(jié):
在最后,我們對(duì)這款顯卡進(jìn)行了20分鐘的烤機(jī)測(cè)試,測(cè)試室溫在18攝氏度。測(cè)試采用了FurMark1080P的極端烤機(jī)方式。

此時(shí)GPU頻率2685MHz,GPU溫度55度,熱點(diǎn)溫度65.6度,GPU使用率99%,風(fēng)扇轉(zhuǎn)速41%,顯卡功耗548.97W。
這里需要注意的是,可以長(zhǎng)時(shí)間維持在548W功率是iGame RTX 4090水神最大亮點(diǎn),這使得它游戲性能表現(xiàn)顯著優(yōu)于同GPU的風(fēng)冷型號(hào)。有傳聞NVIDIA原本打算將RTX 4090的功耗設(shè)定為600W,充分發(fā)揮Ada架構(gòu)的能量,但是考慮到這將給AIC的風(fēng)冷設(shè)計(jì)提出很大考驗(yàn),故退而將標(biāo)準(zhǔn)功率限定在450W,因此大多數(shù)風(fēng)冷非公版RTX 4090的功耗上限止步于450W。

超大的功率帶來(lái)不僅僅是GPU熱量的增加,供電系統(tǒng)因轉(zhuǎn)換效率損失的發(fā)熱也會(huì)成比例提升,這就需要一個(gè)幾何結(jié)構(gòu)精巧的,嚴(yán)絲合縫的,大面積全覆蓋式的散熱接觸面,將核心、顯存與供電的發(fā)熱一并解決,顯然非液冷所不能駕馭。
這便是七彩虹精心布局液冷顯卡,推出水神系列的初衷。憑借一個(gè)量身定制液冷頭,360mm冷排的超大散熱儲(chǔ)備,七彩虹可以游刃有余地使iGame RTX 4090水神的功率大幅度突破上限,還原了NVIDIA最初的設(shè)定。要知道在如此極端的狀態(tài)下,GPU也只有55℃,這要比大多數(shù)450W的風(fēng)冷RTX 4090出色的多,用游刃有余來(lái)形容毫不夸張。
摩爾定律已經(jīng)逐漸走到盡頭,今后可能在很長(zhǎng)的一段時(shí)間里,顯卡性能的提升會(huì)伴隨著更大幅度的功率增加,液冷或許成為旗艦顯卡的標(biāo)配。

最后關(guān)于這次Ada架構(gòu)創(chuàng)新技術(shù)DLSS3再說(shuō)兩句:
通過(guò)游戲性能測(cè)試來(lái)看,在中低分辨率游戲時(shí),我們發(fā)現(xiàn)CPU在部分游戲中遇到了瓶頸現(xiàn)象,甚至有的游戲出現(xiàn)了1080P跑不過(guò)2K的表現(xiàn)。

當(dāng)然,這也不是壞事,NVIDIA甚至想到了一個(gè)辦法——將顯卡多余的算例用來(lái)做些別的。
比如光流加速就是這么一項(xiàng)全新的技術(shù),NVIDIA將游戲引擎中的矢量,與光影運(yùn)動(dòng)的矢量結(jié)合在一起,計(jì)算出最精確的像素位移,從而準(zhǔn)確預(yù)測(cè)到下一幀畫(huà)面各像素應(yīng)該在的位置。然后進(jìn)行添加。
如果顯卡算力吃緊的情況下,“補(bǔ)幀”無(wú)疑是一項(xiàng)費(fèi)力不討好的事情,它既增加了延遲,又浪費(fèi)了顯卡的算力使得正常幀計(jì)算受阻。但是當(dāng)顯卡出現(xiàn)“算力過(guò)?!钡那闆r時(shí),額外的算力用來(lái)做些提升流暢度,甚至是附加光影計(jì)算,肯定是再好不過(guò)的事情了。
很顯然,擁有72MB二級(jí)緩存的RTX 4090就可以非常輕松的完成這件事情。
當(dāng)然,在此我們也是期待著處理器的性能可以進(jìn)一步提高,只有這樣,才可以更進(jìn)一步發(fā)揮顯卡的性能。