芯東西(公眾號:aichip001)
作者 |? 云鵬
編輯 |? 心緣

RTX 5090,老黃的最新核彈,一經(jīng)發(fā)布就引爆了整個PC圈,今天,它終于將最后一塊面紗解下,實(shí)測性能正式解禁。

芯東西1月24日報道,英偉達(dá)GeForce RTX 50系新顯卡的旗艦款GeForce RTX 5090以及中國合規(guī)版GeForce RTX 5090 D今天解禁了性能測試,芯東西提前拿到了RTX 5090 D并重點(diǎn)針對其游戲、生產(chǎn)力、AI三方面進(jìn)行了測試。

測試中我們使用了目前地表最強(qiáng)游戲顯卡RTX 5090 D+地表最強(qiáng)游戲CPU AMD銳龍7 9800X3D+的組合。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲七彩虹RTX 5090 D Advanced

眾所周知,這一代顯卡尤其強(qiáng)調(diào)AI技術(shù)的深度應(yīng)用,芯東西也專門針對RTX 50系背后的逆天游戲“兵器庫”進(jìn)行了深入解讀深度揭秘RTX 5090八大看點(diǎn):游戲“兵器庫”逆天,將AI煉丹術(shù)塞到桌面)。

所以AI到底只是PPT上的數(shù)倍暴漲,還是實(shí)際游戲中實(shí)打?qū)嵉膸瑪?shù)提升、畫質(zhì)提升,這是玩家們非常關(guān)心的話題,也是我們今天要通過實(shí)際測試回答的問題。

直接說結(jié)論:在支持DLSS 4的游戲中,《賽博朋克2077》竟然直接飆到了400多幀,簡直逆天;RTX 5090 D相比RTX 4090 D有著翻倍的幀數(shù)表現(xiàn),幀數(shù)飆漲,直接讓3A單機(jī)游戲第一次有了突破240Hz的終極電競級體驗(yàn)。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲400幀的《賽博朋克2077》(4K分辨率、開啟光追最高設(shè)置及路徑追蹤、DLSS超分辨率為超級性能檔、開啟DLSS 4多幀生成,其他畫質(zhì)選項(xiàng)全部為最高)

RTX 5090 D在生產(chǎn)力和AI方面的技術(shù)點(diǎn)也都點(diǎn)在了“刀刃”上,在FP4下,AI圖像生成速度相比RTX 4090 D最高有150%以上的提升。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲RTX 5090 D與RTX 4090 D在部分代表性AI測試項(xiàng)目中的成績對比

16499元的中國合規(guī)版RTX 5090 D,著實(shí)香爆了。

去年的英偉達(dá)Blackwell B200企業(yè)級核彈可以說成為數(shù)據(jù)中心GPU市場的AI新王炸,而今天,英偉達(dá)在面向消費(fèi)者的GeForce系列中也加入了一系列AI“秘密武器”,讓AI給日常游戲和生產(chǎn)力帶來顛覆性體驗(yàn)。

如果用英偉達(dá)的話來說,AI會是影響游戲產(chǎn)業(yè)未來二十年的最關(guān)鍵技術(shù)。從DLSS 4帶來的幀數(shù)數(shù)倍提升,到AI在游戲的紋理、材質(zhì)、光線反射、Mega Geometry乃至NPC構(gòu)建中的應(yīng)用。

英偉達(dá)實(shí)實(shí)在在地推開了AI游戲時代的大門。

一、打破游戲“不可能三角”,400幀的《賽博朋克2077》到底有多爽?

此次中國合規(guī)版RTX 5090 D沒有公版,我們拿到的是七彩虹iGame RTX 5090 D Advanced,七彩虹作為核心AIC廠商之一,此次在顯卡設(shè)計上較為用心。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲七彩虹iGame RTX 5090 D Advanced

其供電規(guī)格較為豪華,顯卡做工用料扎實(shí),厚度有3槽位厚,其外觀在點(diǎn)亮后極具科技感,還支持燈光同步以及一鍵開啟Turbo模式。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲七彩虹iGame RTX 5090 D Advanced產(chǎn)品細(xì)節(jié)

七彩虹作為目前全球第一大顯卡出貨廠商,在產(chǎn)品的性價比方面一直做的較為極致,此次七彩虹iGame RTX 5090 D Advanced的售價與官方指導(dǎo)價看齊,同為16499元。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲七彩虹iGame RTX 5090 D Advanced

在測試平臺的CPU配置方面,我們選擇了英偉達(dá)官方評測推薦CPU——AMD銳龍7 9800X3D,這也是目前在游戲玩家中呼聲最高的一款旗艦處理器。根據(jù)公開測試數(shù)據(jù),9800X3D不僅可以實(shí)現(xiàn)較高幀數(shù),在幀率穩(wěn)定性方面也表現(xiàn)不錯。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲測試配置

此次我們在游戲方面的測試重點(diǎn)聚焦于DLSS 4多幀生成功能,這也是一項(xiàng)由AI技術(shù)深度加持的功能。

在測試中,RTX 5090 D均開啟DLSS 4多幀生成,RTX 4090 D則開啟DLSS 3單幀生成,測試分辨率均為4K,有光追選項(xiàng)的游戲全部開啟光追,其他畫質(zhì)設(shè)置全部拉滿,DLSS超級分辨率開到性能檔位。

在性能測試解禁前,玩家圈曾廣泛議論RTX 50系的純傳統(tǒng)光柵渲染性能提升可能比較有限,但實(shí)際上,縱觀當(dāng)今芯片產(chǎn)業(yè)的發(fā)展,單純依靠架構(gòu)、工藝升級,晶體管數(shù)量提升、增大核心面積,已經(jīng)很難實(shí)現(xiàn)顛覆性升級,但應(yīng)用對于硬件的性能需求卻依然在大幅提升。

可以說,通過軟件算法層面的技術(shù)創(chuàng)新去提升芯片在實(shí)際應(yīng)用中的表現(xiàn),是一個必然的方向,也是行業(yè)大勢所趨。

英偉達(dá)作為當(dāng)下AI圈的扛把子,自然深諳此理。

在游戲領(lǐng)域一直有一個“不可能三角”,其三要素為畫質(zhì)、幀率和響應(yīng)速度,在同一個技術(shù)中同時提升流暢度、響應(yīng)速度、畫質(zhì),這在過去是很難實(shí)現(xiàn)的,要突出其中之一,必然要適當(dāng)放棄另外兩項(xiàng)。

但今天英偉達(dá)用AI徹底打破了這一不可能三角。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

1、3A單機(jī)沖上240幀,這種絲滑體驗(yàn)真的“旦用難回”

首先我們來看幀數(shù)表現(xiàn),也就是最核心的流暢度指標(biāo)。直接說結(jié)論,在DLSS 4多幀生成的加持下,重載3A單機(jī)大作的幀數(shù)表現(xiàn)甚至可以用“顛覆想象”來形容。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲RTX 5090 D與RTX 4090 D游戲平均幀表現(xiàn)(4K分辨率、有光追選項(xiàng)的均開啟最高檔位、DLSS超分辨率為性能檔,其他畫質(zhì)選項(xiàng)全部為最高,RTX 4090 D開啟DLSS 3單幀生成,RTX 5090 D開啟DLSS 4多幀生成)

像《賽博朋克2077》、《星球大戰(zhàn):亡命之徒》、《心靈殺手2》這樣的負(fù)載極高的典型3A單機(jī)大作,都可以輕松跑到4K?240幀以上,絲滑流暢。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲《星球大戰(zhàn):亡命之徒》(4K最高畫質(zhì)開啟DLSS 4多幀生成)

要知道,此前這些游戲幾乎都有這“硬件殺手”的稱號,例如《心靈殺手2》在上代RTX 4090 D上,即使開啟了DLSS 3,幀數(shù)都只能艱難破百,最低幀甚至?xí)?0,遠(yuǎn)達(dá)不到電競“144幀”的體驗(yàn),但這次RTX 5090 D的幀數(shù)直接漲到了原來的2倍還多!

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲《心靈殺手2》(4K最高畫質(zhì)開啟DLSS 4多幀生成)

什么概念?240Hz是目前許多電競顯示器的最高刷新率上限,也就是說,在DLSS 4技術(shù)的加持下,英偉達(dá)讓玩家可以在重載3A單機(jī)大作中直接實(shí)現(xiàn)4K電競幀數(shù)級的體驗(yàn),直接吃滿顯示器上限,將最新4K 240Hz電競顯示器的顯示效果發(fā)揮到極致。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲《賽博朋克2077》 Benchmark成績(4K最高畫質(zhì)開啟DLSS 4多幀生成)

多位資深游戲愛好者在了解到這一表現(xiàn)后,都覺得是“不敢相信”的。

上代RTX 4090固然性能也十分出色,但在DLSS 3但加持下,同類游戲基本上只能跑到一半幀數(shù)左右,優(yōu)化好的情況下大約可以實(shí)現(xiàn)4K 120Hz的游戲體驗(yàn)。

在《霍格沃茲之遺》、《龍騰世紀(jì):影障守護(hù)者》這類負(fù)載中等偏上的3A單機(jī)大作中,RTX 5090 D在開啟DLSS 4后的幀數(shù)甚至可以飆至400幀左右。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲《龍騰世紀(jì):影障守護(hù)者》(4K最高畫質(zhì)開啟DLSS 4多幀生成)

《漫威爭鋒》這款新晉熱門第一人稱射擊類競技網(wǎng)游,對畫質(zhì)要求較高,但在DLSS 4的加持下也可以直接跑到近400幀左右的平均幀表現(xiàn)。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲《漫威爭鋒》(4K最高畫質(zhì)開啟DLSS 4多幀生成)

《賽博朋克2077》的游戲幀數(shù)表現(xiàn)在4K分辨率畫質(zhì)設(shè)置拉滿、光追拉滿、DLSS超分開啟超級性能檔,DLSS 4多幀生成開啟下可以直逼400幀大關(guān),而在關(guān)閉了DLSS技術(shù)后,游戲幀數(shù)僅僅在30-40幀左右,DLSS技術(shù)帶來了近10倍的提升。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲《賽博朋克2077》(4K最高畫質(zhì)開啟DLSS 4多幀生成)

在性能檔位下,《賽博朋克2077》的幀數(shù)可以穩(wěn)定在4K 240幀上下。

用3DMark的基準(zhǔn)測試我們可以更平均地看到DLSS 4給游戲帶來的提升。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

關(guān)閉DLSS和開啟DLSS 4,幀數(shù)差距達(dá)到了8倍以上,不禁令人感嘆,老黃的PPT果然是實(shí)實(shí)在在的。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲RTX 5090 D與RTX 4090 D在3DMark DLSS性能基準(zhǔn)測試中的幀數(shù)表現(xiàn)

值得一提的是,不僅是平均幀有大幅上漲,在DLSS 4的加持下,游戲的1%Low幀幾乎也都在100幀以上,甚至《星球大戰(zhàn):亡命之徒》、《賽博朋克2077》和《漫威爭鋒》的1%Low幀都超過了144幀。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲RTX 5090 D與RTX 4090 D游戲1% Low幀表現(xiàn)(4K分辨率、有光追選項(xiàng)的均開啟最高檔位、DLSS超分辨率為性能檔,其他畫質(zhì)選項(xiàng)全部為最高,RTX 4090 D開啟DLSS 3單幀生成,RTX 5090 D開啟DLSS 4多幀生成)

1%Low幀簡單理解就是游戲中“最卡頓的那幾幀”(采集最低的1%的幀數(shù)并進(jìn)行平均)。

也就是說,這些3A單機(jī)大作在最卡頓、最影響體驗(yàn)的情況下,幀數(shù)都已經(jīng)邁過了“電競幀數(shù)”的門檻。

這種絲滑的體驗(yàn),的確是有種“旦用難回”的感覺。

2、開了DLSS 4畫質(zhì)不降反升,魚和熊掌兼得,新模型立大功

除了流暢度的“翻倍式”暴漲,RTX 5090 D實(shí)現(xiàn)如此高幀數(shù),并沒有以犧牲畫質(zhì)為代價,在所有游戲中,我們都將畫質(zhì)設(shè)置直接拉滿,光追也全部開啟最高檔位,這是在最高畫質(zhì)下實(shí)現(xiàn)的電競級幀數(shù)表現(xiàn)。

畫質(zhì)不僅沒有犧牲,反而有進(jìn)步。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲《賽博朋克2077》畫質(zhì)設(shè)置中可以自由選擇超分辨率使用的模型

在Transformer模型的升級之下,很多傳統(tǒng)超分辨率、光線重建、DLAA技術(shù)中的短板問題都得到了明顯優(yōu)化。比如偽影、閃爍、模糊等情況都有明顯優(yōu)化。水體、鏡面等代表性反射面的效果都更細(xì)膩、更真實(shí)了。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲《賽博朋克2077》燈光紋理對比(RTX 4090 D使用傳統(tǒng)CNN模型,RTX 5090 D使用Transformer模型)

最突出的一個感受就是,即便是開了性能檔位,很多游戲的畫面都給人感覺比較“清爽”,畫面比較干凈,并沒有一些DLSS開高之后常見的偽影、噪點(diǎn)等問題。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲《賽博朋克2077》(4K最高畫質(zhì)開啟DLSS 4多幀生成)

比如在《心靈殺手2》中,以前DLSS 3比較容易翻車的鐵絲網(wǎng),這次DLSS 4都拿捏的游刃有余,畫面中鐵絲網(wǎng)邊緣非常清晰銳利,沒有偽影,與此同時,樹木枝葉的邊緣也比較干凈銳利,風(fēng)扇葉片上的重影減少了,電力線上的閃爍也得到了很好的消除,這些都是非常值得肯定的提升。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲《心靈殺手2》網(wǎng)格清晰度對比(RTX 4090 D使用傳統(tǒng)CNN模型,RTX 5090 D使用Transformer模型)

在《賽博朋克2077》、《龍騰世紀(jì):影障守護(hù)者》這兩款游戲中,我們也重點(diǎn)關(guān)注了一些網(wǎng)格、網(wǎng)布、水面、密集線條交錯的場景,在這些場景中,DLSS 4都有不錯的表現(xiàn)。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲《星球大戰(zhàn):亡命之徒》游戲內(nèi)麻布細(xì)節(jié)對比(RTX 4090 D使用傳統(tǒng)CNN模型,RTX 5090 D使用Transformer模型)

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲《賽博朋克2077》游戲內(nèi)水面反射細(xì)節(jié)對比(RTX 4090 D使用傳統(tǒng)CNN模型,RTX 5090 D使用Transformer模型)

可以說,AI“猜圖生圖”的水平的確又上了一個新臺階。

3、延遲不升反降,幀生成穩(wěn)定性亮眼

此前在幀生成技術(shù)剛剛出現(xiàn)時,其延遲問題曾受到廣泛關(guān)注,此次DLSS 4直接用AI生成3幀,是否會進(jìn)一步增加延遲?這也是游戲玩家們非常關(guān)心的。從實(shí)際游戲體驗(yàn)來看,PC延遲不升反降,游戲響應(yīng)速度還更快了。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲RTX 5090 D與RTX 4090 D游戲延遲表現(xiàn)(4K分辨率、有光追選項(xiàng)的均開啟最高檔位、DLSS超分辨率為性能檔,其他畫質(zhì)選項(xiàng)全部為最高,RTX 4090 D開啟DLSS 3單幀生成,RTX 5090 D開啟DLSS 4多幀生成)

即使是在負(fù)載最重的《心靈殺手2》中,延遲也僅有45ms左右,在《漫威爭鋒》這種電競類網(wǎng)游中,延遲只有20ms左右。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲《漫威爭鋒》(4K最高畫質(zhì)開啟DLSS 4多幀生成)

在《霍格沃茲之遺》這款3A單機(jī)中,DLSS 4在實(shí)現(xiàn)420幀左右的平均幀基礎(chǔ)上,延遲還控制在了20ms以內(nèi),可以說是畫質(zhì)、幀率、延遲完美兼顧的典型案例了。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲《霍格沃茲之遺》(4K最高畫質(zhì)開啟DLSS 4多幀生成)

當(dāng)然,在這些游戲中,能夠開啟英偉達(dá)Reflex技術(shù)的都已經(jīng)開啟,根據(jù)英偉達(dá)的技術(shù)解析,Reflex 2技術(shù)在響應(yīng)速度方面再次提升了50%左右,相比原生有著75%的提升。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

不僅延遲低,DLSS 4多幀生成的穩(wěn)定性非常好,這也是很關(guān)鍵的,多幀生成的間隔比較穩(wěn)定,波動很小,反映在游戲體驗(yàn)中,就是流暢是“穩(wěn)定的流暢”,而非“波動流暢”,游戲跟手性很好。

正如前文所說,綜合幀數(shù)、畫質(zhì)、延遲表現(xiàn),我們可以很負(fù)責(zé)任地說,英偉達(dá)是實(shí)實(shí)在在地用AI打破了“游戲不可能三角”,真正將游戲體驗(yàn)帶到了“下一個時代”——3A單機(jī)大作都可以擁有電競級流暢體驗(yàn)的時代。

4、最新黑科技一鍵開啟,便捷性易用性拉滿

最后在游戲方面我們想重點(diǎn)提及的一點(diǎn),是DLSS 4以及相關(guān)AI技術(shù)的易用性。

對于普通玩家們來說,他們不需要了解這些“黑科技”背后的原理,消費(fèi)者需要做的僅僅是把顯卡插到機(jī)箱里,并更新到最新版驅(qū)動,就可以直接體驗(yàn)到這些新技術(shù)帶來的體驗(yàn)質(zhì)變升級。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲《心靈殺手2》畫質(zhì)設(shè)置

一些即使沒有在游戲中內(nèi)置支持DLSS 4的游戲,也可以通過英偉達(dá)官方NVIDIA App直接進(jìn)行“優(yōu)設(shè)”覆蓋生效,比如《漫威爭鋒》以及《龍騰世紀(jì):影障守護(hù)者》,這個使用體驗(yàn)的確是非常便捷。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲《漫威爭鋒》通過DLSS優(yōu)設(shè)設(shè)置幀生成4x

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲《龍騰世紀(jì):影障守護(hù)者》通過DLSS優(yōu)設(shè)設(shè)置幀生成4x

在設(shè)置的過程中,選項(xiàng)非常明確,我們可以直接設(shè)置每一個功能所用到的模型,是CNN模型,還是最新的Transformer模型。我們也可以設(shè)置幀生成是3x還是4x。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲在NVIDIA App中選擇模型

英偉達(dá)把多年深耕積累的AI黑科技打包裝進(jìn)驅(qū)動,消費(fèi)者只需要一鍵升級,就可以直接享受到這些AI技術(shù)帶來的紅利。

值得一提的是,根據(jù)官方消息,在RTX 50系列正式開售時,將會有超過75款游戲和應(yīng)用支持DLSS 4,近期發(fā)售的熱門大作幾乎全部包含在內(nèi),英偉達(dá)的生態(tài)支持完善性還是不錯的。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

二、生產(chǎn)力多項(xiàng)新特性升級,建模、視頻、AI樣樣精通

既然是英偉達(dá)的旗艦顯卡,生產(chǎn)力自然也是不少消費(fèi)者關(guān)注的重點(diǎn),從3D渲染、視頻編解碼到生成式AI能力,RTX 5090 D的表現(xiàn)可圈可點(diǎn)。

RTX 5090的AI峰值算力是3352TOPS。RTX 5090 D在硬件配置上是一樣的,AI算力受合規(guī)限制到2375TOPS,比5080高了約32%,是RTX 4090 D的1177TOPS的2倍。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

據(jù)媒體報道,RTX 5090 D在運(yùn)行一些敏感受限應(yīng)用時會受到算力限制。但對于日常生產(chǎn)力應(yīng)用或者消費(fèi)級市場中常見的AI推理,比如AI生圖、AI文本生成,影響較小。

在實(shí)際測試中,RTX 5090 D的確在日常生產(chǎn)力應(yīng)用中都有著不錯的提升,相比RTX 4090 D提升幅度多在30%到90%之間,AI應(yīng)用方面的性能提升幅度最高超過150%。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲達(dá)芬奇測試為RTX 5090 D硬件編碼與14900K CPU軟件編碼對比

比如在主流建筑可視化軟件D5渲染器中,RTX 5090 D就可以實(shí)現(xiàn)相當(dāng)高的場景預(yù)覽幀數(shù)表現(xiàn)。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲D5實(shí)際場景預(yù)覽畫面

在負(fù)載極高的一個別墅場景中,平均幀甚至可以來到“電競級”的160幀,相比之下,RTX 4090 D只能跑到87幀左右的預(yù)覽成績。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲D5場景預(yù)覽

這種絲滑的場景預(yù)覽體驗(yàn),無疑可以顯著提升建筑師的設(shè)計效率以及給客戶展示預(yù)覽成果的實(shí)際效果。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲D5渲染器界面

在視頻編解碼方面,此次RTX 5090 D增加了對4:2:2 H.264/H.265視頻的編碼和解碼支持,上代RTX 40系支持4:2:0和4:4:4的硬件視頻編解碼,但不支持4:2:2。

簡單理解,4:2:2的色度采樣模式可以在保留更多顏色信息與減小文件大小和帶寬需求之間取得更好的平衡,額外的顏色信息對于HDR內(nèi)容創(chuàng)作以及精細(xì)顏色校準(zhǔn)工作流有很大幫助。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

實(shí)際上,在顯卡實(shí)現(xiàn)硬件級支持之前,基于軟件的4:2:2編碼會給CPU帶來極高負(fù)載,如今RTX 5090 D可以直接從硬件層面實(shí)現(xiàn)對H.264/H.265視頻格式的4:2:2編碼支持,視頻處理效率進(jìn)一步提升。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲達(dá)芬奇視頻導(dǎo)出設(shè)置

根據(jù)實(shí)際測試,基于RTX 5090 D直接輸出4:2:2編碼的視頻,速度比基于CPU的編碼解決方案速度快了10倍以上,接近11倍。

在實(shí)際測試中,基于達(dá)芬奇,輸出同樣一段4:2:2編碼10bit的高質(zhì)量4K視頻,RTX 5090 D的完成時間在2分半左右,而基于英特爾旗艦CPU 14900K的軟件方案則耗時26分15秒左右。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲RTX 5090 D與14900K以4:2:2編碼10bit導(dǎo)出4K視頻耗時對比

在常用的GPU渲染性能測試工具V-Ray Benchmark中,RTX 5090 D也跑出了超過15100分的成績,相比RTX 4090 D提升幅度約有36%,還是相當(dāng)可觀的。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

接下來我們看看RTX 5090 D在AI生產(chǎn)力方面的表現(xiàn)。如今AI大模型的復(fù)雜度和參數(shù)規(guī)模都不斷增長,通過端側(cè)消費(fèi)級硬件來運(yùn)行這些模型其實(shí)是有很大挑戰(zhàn)的。

這代RTX 50系增加了對原生FP4的支持,FP4可以更好地壓縮模型的大小,跟當(dāng)下常見的FP16量化方式相比,F(xiàn)P4的顯存占用率不到一半,但性能卻翻了一倍,更低的顯存占用也讓更多旗艦之外的中端顯卡在AI方面有了一戰(zhàn)之力。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲RTX 5090 D與RTX 4090 D在AI圖像生成、AI文本生成等基準(zhǔn)測試中的成績對比

在UL Procyon FLUX.1 Dev測試中,RTX 5090 D在FP4下的測試成績是3.9秒左右,而基于FP8的RTX 4090用時大約為9.8秒。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲RTX 5090 D在UL Procyon FLUX.1 Dev測試中的成績

在AI性能方面,我們基于UL Procyon測試了RTX 5090 D在AI圖像生成、AI文本生成等幾個主要應(yīng)用場景的成績,其相比RTX 4090 D都有比較明顯的提升。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲UL Procyon程序內(nèi)的各類AI基準(zhǔn)測試

在AI圖像生成SDXL FP16測試中,RTX 5090 D有著43%的性能提升,圖像生成速度在7秒左右,而RTX 4090 D則需要10秒以上。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲AI圖像生成基準(zhǔn)測試,左側(cè)成績?yōu)镽TX 4090 D,右側(cè)成績?yōu)镽TX 5090 D

在AI文本生成方面,我們基于Procyon測試了Phi-3.5-mini、Mistral-7B、Llama-3.1-8B、Llama-2-13B等幾款主流熱門模型,RTX 5090 D的性能總分領(lǐng)先在35%左右。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲RTX 5090 D AI文本生成基準(zhǔn)測試成績

尤其在平均生詞速度上,RTX 5090 D的領(lǐng)先幅度進(jìn)一步擴(kuò)大到46%。

MLPerf是目前行業(yè)內(nèi)比較權(quán)威和常用的機(jī)器學(xué)習(xí)基準(zhǔn)測試,在MLPerf-Client v0.5中,RTX 5090 D在各類推理性能基準(zhǔn)測試中也都有不錯的表現(xiàn)。

最強(qiáng)AI顯卡一手實(shí)測!英偉達(dá)RTX 5090 D滿滿狠活:老黃誠不我欺

▲MLPerf測試過程

值得一提的是,根據(jù)官方給出的RTX 5090公版測試數(shù)據(jù),中國合規(guī)版RTX 5090 D在這些日常消費(fèi)者可以接觸到的AI應(yīng)用中,性能幾乎沒有差別,可以說對普通消費(fèi)者的日常使用幾乎沒有影響。

總體來看,RTX 5090 D雖然在AI算力層面受到了一定的限制,但在消費(fèi)者日常所接觸到的游戲或生產(chǎn)力場景中,相較上代都有非常直觀的提升,并且與RTX 5090公版的性能幾乎沒有差別,結(jié)合其16499元的建議零售價,的確是國內(nèi)玩家和創(chuàng)作者們的新神器。

結(jié)語:計算圖形學(xué)“下個時代”到來,AI顯卡走入百姓家

DLSS 4實(shí)現(xiàn)8倍的幀率提升、神經(jīng)網(wǎng)絡(luò)著色器實(shí)現(xiàn)更好的畫質(zhì)、Reflex 2降低高達(dá)75%的延遲,RTX 5090 D的諸多技術(shù)升級,都令其在游戲、生產(chǎn)力方面有著令人驚艷的性能提升。

值得一提的是,在如今芯片廠商普遍高舉“能效比”大旗沖鋒的當(dāng)下,英偉達(dá)的桌面消費(fèi)級顯卡并沒有一味追求能效比,而是在功耗小幅增長的情況下,將AI技術(shù)與硬件深度融合,實(shí)現(xiàn)實(shí)際性能表現(xiàn)的翻倍式提升。

這樣的發(fā)力方向,顯然是廣大PC臺式機(jī)游戲玩家和創(chuàng)作者們所喜聞樂見的。

用英偉達(dá)的話來說,神經(jīng)網(wǎng)絡(luò)渲染是計算機(jī)圖形學(xué)的“下個時代”。

神經(jīng)網(wǎng)絡(luò)直接深入到圖形渲染的過程當(dāng)中,進(jìn)而讓圖形渲染在性能、質(zhì)量和交互性方面都有真正的飛躍式提升,最終讓游戲玩家有更沉浸高質(zhì)量的游戲體驗(yàn),讓創(chuàng)作者們的生產(chǎn)效率進(jìn)一步提高。

DLSS 4是DLSS技術(shù)發(fā)展多年來的一個里程碑式的節(jié)點(diǎn),但同時也是一個新的開始——消費(fèi)級AI顯卡時代的開始。

在AI手機(jī)、AI PC之后,AI顯卡是真的來了。