欧美午夜精品-免费在线观看高清影视网站-999免费视频-韩国久久久-在线中文av-1024欧美-在线啪-成人影片在线-秋霞在线观看秋-国产精品国产三级国产专区52-国产在线高清视频-国产999在线-国产白拍-毛片在哪里看-日韩视频h-欧美日韩一区精品-在线只有精品-插插插色综合-成年人看的毛片-毛片av免费

最無爭議的老大哥:NVIDIA GeForce RTX 4090公版顯卡首發評測

最無爭議的老大哥:NVIDIA GeForce RTX 4090公版顯卡首發評測

白貓 / 2022-10-11 21:00133803

這兩年對于游戲玩家來說顯然是不太正常的,自從上一代英偉達推出RTX 30系顯卡之后,各大玩家都飽受礦潮之苦,從2020年一直到2022年那些看起來性能十足且極具性價比的30系顯卡與大家徹底無緣,有的只是那些價格高的離譜的礦卡,讓眾多玩家望塵莫及。而到了2022年,經過礦潮摧殘的玩家們亟需性能強勁的新一代顯卡來提升士氣,這時作為顯卡領域執牛耳的英偉達就適時地帶來了RTX 40系顯卡,借助全新的架構與制程為消費者帶來極其強勁的性能。

圖片1.png

只是在公布RTX 40系顯卡的規格之后,RTX 40系顯卡的建議零售價著實讓玩家們議論紛紛,不過這種爭議似乎與RTX 4090顯卡無關,即使從英偉達官方公布的性能來看,RTX 4090顯卡的性能也無疑可以坐穩卡皇的寶座。現在就讓我們一起來感受一下老大哥顯卡帶來的強大實力。

Ada Lovelace架構解析

在《英偉達RTX 40系顯卡解析:出色工藝帶來出色性能,DLSS 3是殺手锏》中,我們對英偉達全新的Ada Lovelace架構進行了一定的介紹,在這里我們會繼續為大家帶來關于Ada Lovelace架構的幾個重點特征。

急劇膨脹的規格

從GPU的架構圖來看,AD102與GA102之間并沒有太大的區別,一個計算單元內包括FP32計算單元,FP32與INT32共享的計算單元以及第四代Tensor Core,同時也包括第三代的RT計算單元,讓深度學習以及光追更加高效。

圖片2.jpg

得益于更加出色的工藝,AD102最高擁有12個圖形處理集群,使得計算單元從84個飛躍至144個(GA102擁有7個圖形處理集群),CUDA的數量也達到了18432顆,并且光追單元從84個提升至144個,深度學習單元從336個提升至576個,頻率也從1.9GHz提升至2.5GHz,而這一切共同組成了擁有763億顆晶體管的GA102。

圖片3.jpg

除此之外,為了讓數據處理更加地具有效率,同時提升重載情況下的數據命中率,這一次英偉達大幅提升了L2緩存,在GA102中的L2緩存為6MiB,而到了AD102則飛躍至96MiB,提升在光追條件下的性能表現。這種加大緩存的行為已經在CPU上得以實現,例如AMD推出的擁有超大緩存的Ryzen 7 5800X3D處理器實現游戲性能的提升。

不過有得有失,在大幅提升L2緩存之外,這一次英偉達去掉了NVLINK傳輸通道,從而讓多卡并行成為了歷史。從SLI一直到NVLINK,最終在RTX 40上,多卡并行落下了帷幕,當然這也和飛速提升的單卡性能有著密切的關系。

高度定制的TSMC 4N工藝

AD102擁有的高達763億顆晶體管實在是讓人感到咋舌,假如沒有優秀的工藝,那么擁有如此龐大晶體管的芯片在全速運行時勢必會引發巨大的熱量,英偉達RTX 30系所采用的三星8N制程工藝的前車之鑒相信大家都聊熟于心。

QQ截圖20221011144546.png

這一次英偉達采用了TSMC 4N NVIDIA定制工藝,也正因為采用了這項工藝,才讓763億顆晶體管塞進與上代相差不大的芯片中成為了可能,并且GPU的頻率也大幅提升,2.5GHz只是正常水平,而在實際運行時候可以達到2.76GHz,英偉達也表示RTX 4090的每瓦性能可以達到RTX 3090的兩倍。

第二代硬件光流加速器

過去得益于光線追蹤技術,讓游戲畫面愈發顯得真實,然而帶來的副作用就是游戲性能的急劇下降。在早期光線追蹤中,游戲幀率會下降33-50%,而當時游戲廠商對于光線追蹤的應用還處于早期階段,例如《戰地5》中,每像素的光追操作達到了39個,而到了《賽博朋克2077》的最新更新中,光追操作更是達到了655個。業界也迫切需要全新的技術來提升在游戲幀率,確保畫面不太損失的前提下獲得足夠的幀率。

圖片5.jpg

此時英偉達推出了DLSS功能也就是深度學習超級采樣技術,這項技術簡單來說借助英偉達的超級計算機不斷訓練AI模型,而讓本地的顯卡在實際游戲渲染的時候進行較低分辨率的渲染,而借助AI再還原成較高的分辨率輸出顯示,這樣做的好處就是可以有效地提升游戲的幀率,即使是高分辨率下也能獲得可觀的幀率。

到了新一代的游戲,光線追蹤技術的再一次進步讓顯卡迎來新的挑戰,這時候就需要新一代的DLSS技術,DLSS 3便在這種情況下應運而生。首先英偉達在RTX 40系顯卡中加入了改進的光流加速器,借助這項計算單元可以實現對于游戲幀畫面的實時推演,提取其中的圖像光流信息,同時參考游戲引擎中的運動矢量信息借助AI生成新的中間幀,此外借助插幀以及超分辨率,讓RTX 40系顯卡只要傳統1/8的渲染量即可實現幾乎相同的畫面輸出,從而讓GPU的傳統圖像渲染引擎得到極大的性能釋放,游戲幀率得到巨大的提升。

當然插幀帶來的弊端就是加大了渲染隊列,提高了游戲的輸出延遲,對此英偉達采用了NVIDIA Reflex來降低游戲的延遲。可以說得益于大幅提升的晶體管數量,讓Ada架構可以實現更多的功能,也讓游戲廠商得以擁有更多資源去開發自家的游戲,使4K@144Hz這樣的顯示器擁有更多的用武之地。

規格參數

今年NVIDIA推出了三款不同的顯卡,包括GeForce RTX 4090、GeForce RTX 4080 16GB以及GeForce RTX 4080 12GB三個型號,其中GeForce RTX 4090最受消費者的關注,而這一次也是這款卡皇率先與大家見面。

圖片6.jpg

NVIDIA GeForce RTX 4090顯卡基于AD102核心,擁有16384顆流處理器,512個紋理單元以及176個光柵單元,像素填充率達到了每秒4435億,而紋理填充率則是12.9萬億。此外搭載24GB的GDDR6X顯存,顯存位寬384Bit,帶寬也達到了1.008TB/s。其他參數方面,NVIDIA GeForce RTX 4090顯卡的核心頻率為2235MHz,Boost頻率為2520MHz,顯存頻率1313MHz,等效21Gbps的速度。Tensor Core也增加了FP8計算單元,增加了顯卡的推理性能。

圖片7.jpg

可以看到的是NVIDIA GeForce RTX 4090顯卡在流處理器以及單精度性能上相比較上一代有著巨大的提升,從而在游戲性能上更加出色。當然擁有16384顆流處理器的RTX 4090顯卡距離完整版AD102的18432顆還有比較大的距離,看起來未來還會有Super、Ti等型號出來,進一步壓榨AD102這顆核心。

外觀

我們接著來看一下NVIDIA GeForce RTX 4090公版顯卡。值得一提的是,本次NVIDIA將限量推出GeForce RTX 4090 FE版,于北京時間10月12日晚9點在京東首發上市,旨在為鐘愛FE版設計的發燒級玩家帶來無與倫比的體驗。屆時玩家可以選購來自NVIDIA FE版和來自頂級顯卡供應商的RTX 4090 GPU標頻版和超頻版。

圖片8.jpg

NVIDIA GeForce RTX 4090公版顯卡給人的最大感受就是一個字大,給人以壓迫眾生的感覺。整卡的長度達到了304×137×61mm,官方表示搭配這款顯卡的電源功率應該為850W,不過基于銳龍9 5900X處理器。要是搭載英特爾12代酷睿處理器或者是銳龍7000系列處理器,那么實際的電源需求應該更大,準備1000W電源較為保險。

圖片9.jpg

NVIDIA GeForce RTX 4090公版顯卡除了龐大的身軀之外,在外觀設計上與上代相差不大,繼承了金屬風,整體展現出的是一種精致感。當然為了提供更好的散熱,NVIDIA GeForce RTX 4090公版顯卡的風扇尺寸也有所增加,官方表示最高可以提供大約20%的風量,提供更高的散熱。

圖片10.jpg

而在NVIDIA GeForce RTX 4090公版顯卡的背部,官方仍然準備了螺絲孔,這種設計主要為工作室或者從事高性能計算的消費者使用,當然或許是上代裸露的螺絲孔不太雅觀,這一次官方準備了磁吸式貼片,增加了顯卡的整體感。

圖片11.jpg

而在輔助供電上,NVIDIA GeForce RTX 4090公版顯卡采用了12+4Pin的供電設計,其中12Pin負責供電,默認條件下可以提供450W的電源輸出,而4Pin則負責信號傳輸,如果說監測到需要更高的電源功率,那么12+4Pin的組合最高可以獲得600W的供電,加上PCIe的供電,足夠一款顯卡穩定地運行。官方也配備了4X8Pin的轉接線,當然現在ATX 3.0的電源越來越多,如果使用原生的PCIe 5.0電源線,可以讓機箱內部的電源線顯得更加整潔。

圖片12.jpg

在接口上,NVIDIA GeForce RTX 4090公版顯卡采用四個接口,包括三個DP1.4a接口以及一個HDMI 2.1接口,這一次官方并沒有采用DP 2.0接口,實屬有點意外。NVIDIA GeForce RTX 4090公版顯卡還是極具精致感,不過龐大的體積對于機箱提出了更高的要求,特別是ITX機箱,不一定能夠請進這位大神安穩入座。

硬件配置

NVIDIA GeForce RTX 4090公版顯卡顯然是一款極其強悍的顯卡,因此我們在硬件配置上也不敢怠慢,為此我們搭載了Intel Core i9-12900K處理器,這也是目前游戲性能最為出色的CPU之一,此外主板采用了ROG的Z690 Hero主板,內存則是英睿達的DDR5內存,總容量達到了64GB,除此之外,我們也選用了WD_BLACK SN850以及WD_BLACK SN770兩款PCIe 4.0 SSD,從而最大程度地減少系統的瓶頸。

圖片13.jpg

此外我們也搭載Window 11 22H2系統,在驅動選擇上,我們采用的是NVIDIA的GeForce 521.90測試驅動,未來關于GeForce RTX 4090顯卡的性能表現將會隨著驅動的變動而有所調整。我們也拿出了GeForce RTX 3080 Ti顯卡作為本次的對比顯卡。

性能表現

理論性能

作為圖形理論測試的首選,3DMark自然是最為流行的測試軟件,通過FireStrike、TimeSpy以及Royal Port分別測試顯卡在DX11、DX12以及光追性能,自然我們也使用3DMark測試了NVIDIA GeForce RTX 4090的理論成績。

圖片14.jpg

在3DMark的測試中,擁有更強規格的GeForce RTX 4090顯卡在3DMark的理論測試中擁有遠超RTX 3080 Ti的成績,平均領先幅度達到了84%,其中FireStrike Extreme的領先幅度僅有51%,TimeSpy為78%,而其他三項成績幾乎都是翻倍。很明顯是因為CPU限制了GeForce RTX 4090顯卡在2K分辨率下取得更高的分數。

圖片15.jpg

除了3DMark之外,我們也測試了在V-Ray這款渲染軟件下的性能表現對比,相比較3DMark,V-Ray更能壓榨顯卡的性能,畢竟是一款生產力工具,而GeForce RTX 4090在性能上相比較RTX 3080 Ti顯卡翻倍。

游戲性能測試

看完了3DMark的理論測試,相信大家對于GeForce RTX 4090的實際游戲測試也十分地感興趣,當然理論測試只能說明顯卡的理論圖形性能,在實際游戲下,由于優化的區別,實際的游戲性能差距會更大或者更小。如今光追游戲是越來越多,因此我們這一次直接將游戲分為傳統光柵化游戲以及光追游戲進行對比測試,此外考慮到GeForce RTX 4090的定位,我們均開啟全特效,同時關閉DLSS,看看在重壓條件下顯卡的性能表現。

光柵化游戲

圖片16.jpg

在傳統的光柵化游戲中,GeForce RTX 4090相比較RTX 3080 Ti性能提升幅度大約在57%,其中《巫師3》游戲提升幅度最高,提升幅度為90%,還是相當給力的。畢竟目前大部分發燒級游戲玩家采用的是4K分辨率的顯示器,而且已經有相當多的4K@144Hz的電競顯示器問世,借助GeForce RTX 4090強大的性能,即使是不開啟DLSS這樣的黑科技也可以達到144幀的速率。

圖片17.jpg

而在2K分辨率下,GeForce RTX 4090的平均領先幅度在50%,實際上對于GeForce RTX 4090這樣的顯卡來說,2K分辨率已經完全不夠用,甚至部分游戲像《APEX》撞上了幀數墻,并且GPU功耗也有所浮動,甚至GPU占用率也并非達到99%,可見此時CPU已經出現了瓶頸,這在以往的測試中十分地少見。應該來說GPU再一次走到了CPU的前面。

光追游戲

圖片18.jpg

相比較傳統的光柵化游戲,由于搭載了新一代的光追計算單元,因此GeForce RTX 4090在光追游戲中的表現遠超光柵化游戲,相比較GeForce RTX 3080 Ti來說提升幅度也更大,平均提升幅度達到了88%,其中像《殺手3》、《邊境》、《賽博朋克2077》等重壓游戲更是可以擁有超過100%的性能提升。不過我們也可以看到像《光明記憶》、《賽博朋克2077》在開啟全光追特效之后,即使是GeForce RTX 4090也感到十分地吃力,幀率表現也勉強可玩,這時候就要DLSS出馬了。

圖片19.jpg

而在2K分辨率的測試中,GeForce RTX 4090同樣出現了CPU瓶頸,特別是《德軍總部:新血脈》以及《Far Cry 6》這兩款游戲,在2K分辨率下的表現與4K相差不大,只能說或許是Vulkan API的渲染機制問題以及育碧的祖傳優化,導致GeForce RTX 4090完全沒有發揮實力。當然扣除這兩個異常的游戲成績,GeForce RTX 4090相比較RTX 3080 Ti提升幅度在75%左右。

通過上述的游戲對比,GeForce RTX 4090在光追以及4K分辨率下能夠取得更加出色的成績表現,越高壓表現越出色,而在2K分辨率下,實際提升幅度就沒有4K這么大,這是由于除了GPU之外,包括CPU、內存頻率以及帶寬已經成為了制約顯卡發揮全力的幾個原因。

DLSS 3

在RTX 40系顯卡中,除了傳統的游戲性能表現之外,最大的特色就是獨占的DLSS 3技術,這項技術借助RTX 40系顯卡內置的光流處理器實現游戲幀畫面的模擬和插幀,大幅提升游戲的幀率,并且在4K分辨率下,實際游戲畫面也沒有什么損失,基本上難以分辨,可以說是為今后8K分辨率所準備的一項技術,那么英偉達DLSS 3的性能究竟如何?它和DLSS 2相比,性能究竟提升有多少?

由于目前DLSS 3的游戲和應用要在40系顯卡上市之后才陸續正式發布,因此我們基于幾款游戲以及軟件的測試版進行測試,實際體驗與正式版或許有一定的出入。

圖片20.jpg

圖片21.jpg

我們以目前支持DLSS 3的《逆水寒》以及《賽博朋克2077》為例,看看DLSS 3是怎么進行設置的,可以看到在新版的DLSS設置中,包括了NVIDIA DLSS、DLSS Frame Generation、DLSS Super Generation和DLSS銳化的設置,此外《逆水寒》不僅提供全測試場景的路徑追蹤實現全景光線追蹤,還提供了NVIDIA Reflex的設置。其中DLSS Super Resolution就是目前的DLSS 2,包括自動、性能、質量、超級性能等選項,而DLSS Frame Generation則是DLSS 3的開關。也就是說即使你購買了GeForce RTX 4090這樣的RTX 40系顯卡,那么也可以開啟DLSS 2以獲得更低的渲染延遲。

考慮到DLSS 3通過插幀實現幀率上升,因此無疑會增加渲染延遲,因此絕大部分的游戲測試中,DLSS 3均與NVIDIA Reflex綁定,只要開啟DLSS 3,那么NVIDIA Reflex默認便是打開的狀態。

圖片22.jpg

圖片23.jpg

圖片24.jpg

首先是DLSS 3的畫質,從原理上,DLSS 3基于光流計算獲取幀信息,利用AI來繪制出相應的圖片進行插幀,因此其畫質與DLSS 2相差不大。此外經過游戲廠商這幾年的開發,在4K與最高畫質下,DLSS 2已經可以讓畫質損失達到可以接受的程度,通過上述的對比圖便可以看到,三者之間的差距幾乎可以忽略不計,當然三者的游戲幀率相差比較大。

圖片25.jpg

圖片26.jpg

在《逆水寒》的一段可以媲美CG電影的全景光追Demo中,我們可以比較明顯地發現DLSS 3與原生4K分辨率之間的區別。由于DLSS會對畫面進行銳化處理,因此地板的紋理是DLSS 3更加清晰,而在亭子后面的欄桿處,DLSS 3已經出現了欄桿畫面碎裂的情況,遠景也比原生4K更加模糊。當然像《逆水寒》這樣的Demo,更像是對于游戲特效的一次炫技。

圖片27.jpg

那么DLSS 3對于性能提升究竟達到怎樣的程度,首先是基于GeForce RTX 4090下開啟DLSS 3與否的性能對比。可以看到在重壓條件下,即使是像GeForce RTX 4090這樣的卡皇,在運行《逆水寒》這樣的游戲也是壓力巨大,僅有17幀,這里的逆水寒為全景光追Demo,實時渲染對于GPU的壓力達到了讓人咂舌的地步,不過畫質也可以媲美CG級電影,而開啟DLSS 3之后,幾款游戲的幀率有著巨大的提升,平均幅度在300%左右,而《逆水寒》更是可以達到4.94倍,可以說DLSS 3帶來的幀率提升極其明顯。

圖片28.jpg

圖片29.jpg

當然我們也測試了GeForce RTX 4090開啟DLSS 3與GeForce RTX 3080 Ti開啟DLSS 2下的幀率表現,以及GeForce RTX 4090在開啟DLSS 3與DLSS 2之間的幀率差別。在雙方開啟性能DLSS的前提下,GeForce RTX 4090的平均幀率是GeForce RTX 3080 Ti的2.62倍,而GeForce RTX 4090開啟DLSS 3相比較DLSS 2,平均幀率也提升了42.7%,提升幅度還是相當給力。

圖片30.jpg

從原理上說,DLSS 3借助AI模擬與插幀實現游戲幀率的提升,那么不可避免地會增加圖像渲染隊列,進而增加時延,那么DLSS 3除了會大幅提升游戲幀率之外,對于游戲的時延影響究竟有多深?對此我們使用《Lyra》進行測試,通過FrameView查看游戲的實時時延。

圖片31.jpg

通過對比可以發現,在關閉DLSS下,由于游戲幀率的限制,圖像渲染延遲已經達到了63.87ms,而在開啟DLSS 2下,圖像渲染延遲大幅下降,達到了30.46ms。而在開啟DLSS 3的前提下,圖像渲染延遲快速提升至51.76ms,當開啟Reflex PlusBoost下,游戲渲染延遲與DLSS 2相差不大,為32.44ms,當然最低的還是DLSS 2開啟Reflex,延遲僅為17ms上下。因此借助NVIDIA Reflex,即使開啟DLSS 3,游戲的延遲也可以與DLSS 2相提并論。當然如果說你是一名電競玩家,希望獲得最低的延遲,那么開啟DLSS 2和NVIDIA Reflex是最佳的選擇,畢竟GeForce RTX 4090應付電競游戲沒有絲毫壓力。

目前, DLSS 3已經得到了許多全球領先游戲開發者的支持, 其中《超級人類》、《生死輪回》、《逆水寒》“拂云庭“、《微軟模擬飛行》以及《瘟疫傳說:安魂曲》將會在第一時間增加對于DLSS 3的支持,總計超過35款游戲和應用宣布即將支持該技術,包括《賽博朋克2077》、《光明記憶: 無限》、《黑神話: 悟空》、《漫威蜘蛛俠: 重制版》等3A大作。

功耗和溫度

在實際測試中,我們經常會遇到一種情況,那就是游戲玩著玩著性能大幅下降,這是由于顯卡散熱不盡如人意所導致的GPU降頻,因此一款顯卡散熱的好壞同樣會影響到實際的顯卡性能發揮。而這一代為了應對AD102全速運行時候的巨大熱量,英偉達對GeForce RTX 4090顯卡的散熱器進行了優化和改良,包括增加了進風量,使散熱性能得到巨大的提升,當然體積也變得更加碩大,那么這一代的公版顯卡在散熱表現上是否有比較大的提升,顯卡功耗究竟如何?我們使用3DMark TimeSpy Extreme壓力測試,同時使用FrameView以及GPU-Z等軟件記錄GPU的溫度。

圖片32.jpg

得益于全面改良的散熱器,GeForce RTX 4090公版顯卡這一次的散熱表現十分地出色,GPU的最高溫度僅在68度左右,遠勝于上一代公版的83攝氏度,之前有一種猜測是全新的散熱器可以承受600W左右的TGP,自然對450W的GeForce RTX 4090來說是小菜一碟。而在功耗方面,盡管GeForce RTX 4090的TGP為450W,但是實際測試其功耗基本上在400-410W之間浮動,僅有最高功耗能夠觸及415W上下,距離官方的450W的TGP還有很大的一段距離,這其中一個重要的原因在于此時的系統已經出現了瓶頸,因此無法壓榨顯卡的所有性能。

超頻

在實際測試中,我們發現盡管Boost頻率為2520MHz,但是顯卡的實際頻率卻可以輕而易舉地超過2700MHz,全速運行下的頻率也達到了2760MHz。可見這一代臺積電4nm工藝的強大,當然我們也希望借助超頻工具,看看在超頻條件下,這塊GeForce RTX 4090顯卡能夠達到怎樣的頻率。

圖片33.jpg

經過簡單的超頻,GeForce RTX 4090顯卡的頻率可以達到3060MHz,此時TimeSpy Extreme的跑分可以達到20386分,比默頻成績提升了5%,顯卡的功耗也達到了420-430W。臺積電4nm工藝也讓這顆GPU有著比較出色的超頻性能。

總結:當之無愧的顯卡老大哥

作為礦潮之后誕生的新一代顯卡,RTX 40系注定是充滿爭議的,尤其是顯卡的定價更是如此。尤其是礦難導致顯卡價格雪崩,讓消費者在選購新顯卡的時候勢必要反復挑選,最終選擇適合自己的顯卡。當然這種糾結的選擇對于GeForce RTX 4090顯卡這樣的卡皇來說并不存在,因為它的性能實在是過于強大,基于AD102核心的GeForce RTX 4090顯卡憑借著暴力的流處理器堆疊,無論是光柵游戲還是光追游戲,相比較上一代均有極其明顯的性能提升,平均幅度也達到了65-80%。

更不用說DLSS 3這樣的黑科技,讓GeForce RTX 4090顯卡的游戲表現達到了新的高度,即使面對全景光追的游戲也絲毫不怵,再加上AV1編解碼等技術的加持,GeForce RTX 4090顯卡也極具生產力,可以說是一款不折不扣的卡皇。

圖片34.jpg

此外這一代公版顯卡在散熱上也進行了大幅的優化,愈發出色的散熱器讓公版顯卡也可以獲得與非公版顯卡相差不大的散熱表現,解決了發燒級玩家的一個痛點,再加上12999元的售價以及NVIDIA信仰的加成,今年的公版顯卡可謂是性價比十足。更為重要的是,今年NVIDIA將會在國內開賣這塊公版顯卡,大家在以原價購買這款顯卡的同時,還可以享受應有的保修政策。

當然這個世界上也沒有完美的產品,GeForce RTX 4090顯卡也不例外,其龐大的體積對于ITX玩家來說似乎是一個噩夢,甚至部分MAT機箱也因為長度的原因與這代的旗艦顯卡告別。對于這類用戶來說,選擇中塔乃至全塔式機箱,或者購買相對小巧的水冷顯卡,或許是一個更加理智的選擇。


發表評論注冊|