
NVIDIA 在本月初的 CES 上,隨著 GeForce RTX 50 系列「Blackwell」GPU 一起發表了 DLSS 4。多幀生成 (MFG) 是 RTX 5090 及其同系列的獨有功能,但所有 RTX GPU 都將獲得改良的升頻功能。從 CNN 轉變為基於 Transformer 的神經網路,可提供更清晰的影像,在各個幀中保留更多細節和光線追蹤照明樣本。升級後的幀生成模型速度更快,且使用的 VRAM 比現有實作少 30%。
延伸閱讀:
DLSS 4 與 DLSS 3:Transformer 與 CNN

DLSS 3 和 2 利用卷積神經網路 (CNN),其運作方式是識別影像中的模式(或圖塊),包括邊緣、形狀、顏色、紋理、深度等。為每個模式形成特徵圖,並透過彼此學習,形成能夠識別複雜幾何圖形的複雜圖。 運動向量 有助於追蹤這些模式在各個幀中的變化,而高解析度幀是透過比較低解析度輸入與先前渲染的高解析度幀來建構的。
DLSS 4 以基於 Transformer 的模型取代 CNN,該模型能夠執行 自我注意 運算。這讓模型能夠判斷每個像素(或模式)在多個幀中的重要性。產生的影像更穩定且細緻,減少了運動中的殘影和鋸齒。除了提高升頻品質外,Transformer 模型還產生卓越的光線追蹤輸出,尤其是在反射和漫射照明方面。
DLSS 4 與 DLSS 3 影像比較
我們在《電馭叛客 2077》、《Alan Wake 2》和《霍格華茲的傳承》中測試了 DLSS 4 及其 Transformer 模型。與 DLSS 3.7 相比,影像品質有顯著提升,主要是在細薄、複雜的幾何圖形、漫射陰影和反射方面。以下所有比較都是在 4K 解析度下,使用路徑追蹤,並將 DLSS 設定為「效能模式」下進行的。點擊圖片可放大。
DLSS 4 與 DLSS 3:陰影和幾何細節


(滑桿比較)
上述兩張照片之間的差異顯而易見。DLSS 4 的 Transformer 模型在保留複雜的幾何和照明細節方面要好得多。最明顯的是保留了粉紅色色調,這是陽光明媚的傍晚的特徵。環境陰影沿著裂縫、邊界和凹槽也更加細緻。


上面的 2 倍放大特寫顯示了 DLSS 4 的 Transformer 模型在處理細薄、精緻的物體(如 鐵絲網)時的準確度有多高。紋理更細緻(不模糊),並在背景中準確地投射陰影。


相比之下,FSR 3 和 XeSS 2 一團糟,失去了中心附近的大部分細節,並且遺漏了周圍的陰影和環境光遮蔽。


(滑桿比較)
上面的比較突顯了兩種升頻模型在環境光遮蔽或 漫射陰影 品質方面的巨大差異。DLSS 4 的 Transformer 模型準確地渲染了明亮日光下的環境陰影,而 DLSS 3 則失去了大部分陰影,可能是被間接照明沖刷掉了。同樣地,FSR 3 和 XeSS 2 遺漏了大部分陰影,產生了鋸齒狀的圍欄。DLSS 4 巧妙地保留了線路上的陰影,否則會被它的同類產品遺漏。


下面的比較突顯了沿著橋樑底座的細節保留的改善,以及 DLSS 4 顯著減少了模糊/污損。棕櫚樹的陰影更加均勻,在中心附近投射出更濃密的陰影,而在頂部則更加明亮。


(滑桿比較)
由 FSR 3 和 XeSS 2 升頻的影像由於過度銳化而產生相當多的雜訊,並且在整個場景中失去了大量的色彩和陰影。


DLSS 4 與 DLSS 3:照明與反射
DLSS 4 及其 Transformer 模型為鏡面照明或反射創造了奇蹟。不僅反射更清晰,而且它們保留了更多與遠處物體相關的細節,鏡面表面準確地在場景中散射光線。這反過來又增強了全域照明,產生準確的陰影和細緻的反射(請參閱花盆)。


(滑桿比較)
FSR 3 和 XeSS 產生模糊的反射,但在其他方面並不比 DLSS 3.7 差多少。鏡面表面的處理方式類似。


這是另一個範例,說明 DLSS 4 如何增強 DLSS 3.7 和 FSR 3 的鏡面反射和照明。減少雜訊、覆蓋遠處物體和卓越的色彩吸收值得注意。



(滑桿比較)
- 電馭叛客 2077
DLSS 4 與 DLSS 3:《Alan Wake 2》
《Alan Wake 2》利用的是 FSR 2 而不是較新的實作。因此,我們將比較限制在 DLSS 3 和 4,並將圖形設定最大化,並將升頻預設設定為效能。


(滑桿比較)
放大影像會顯示一些關鍵差異。首先,DLSS 4 渲染出更長、更完整的反射,這些反射遍布整個場景的彩色照明。光線徹底地散射在封閉和遙遠的表面上,遠處的光源也有助於附近的(漫射)照明。最後,雨滴(右上角)未使用 DLSS 3 保留。DLSS 4 不會犯同樣的錯誤。


(滑桿比較)
上面是一個很好的例子,說明 DLSS 4 如何渲染更準確的漫射「柔和」陰影,而 DLSS 3 則導致模糊的輪廓,邊界周圍有雜訊。請注意 沙發、柱子 和 桌子 投射的陰影。Transformer 模型消除了陰影雜訊,並保留了照亮瓦片間凹槽的漫射照明。奇怪的是,它也模糊了瓦片圖案。
- Alan Wake 2
DLSS 4 與 DLSS 3:《霍格華茲的傳承》
《霍格華茲的傳承》僅具有光線追蹤陰影、反射和環境光遮蔽。不知何故,它的執行效果仍然比使用路徑追蹤的《電馭叛客 2077》更差。下面的範例顯示了 DLSS 4 如何改善沿著樹枝較細末端的細節保留。


(滑桿比較)
雖然差異相對細微,但您可以看到 DLSS 4 比 原生 4K 保留了更多細節。您正在透過以接近兩倍的幀率輸入 1080p 來渲染更高品質的 4K 影像。



下面是一個很好的例子,說明 DLSS 3 如何遺漏在原生解析度下可見的一些漫射陰影(請參閱屋頂)。DLSS 4 不僅保留了這些陰影,而且還透過改善燈柱上和周圍的照明細節來超越原生。



(滑桿比較)
下面來自「大廳」的比較突顯了對光線追蹤反射所做的改進。DLSS 4 的 Transformer 模型由於卓越的降噪(光線重建)而產生更清晰、更逼真的反射。這導致鏡面反射周圍出現漫射反射,並且表面細節保留到更高的程度。


(滑桿比較)
原生渲染無法像使用光線重建的 Transformer 升頻模型那樣對反射進行降噪。無論如何,較舊的CNN 模型產生與原生相似的品質,而FSR 和XeSS 則落後。


- 霍格華茲的傳承
DLSS 3 與 DLSS 4 幀生成:VRAM 使用量
我們在 GeForce RTX 4090 上對三款遊戲進行了基準測試,以檢查使用 DLSS 4 是否有效能提升。沒有,但 VRAM 使用量確實使用更新的模型略有下降。《電馭叛客 2077》在使用 DLAA 和幀生成時,在 4K「最大」設定下,下降了超過 300 MB。啟用升頻會使圖形記憶體消耗量減少 100-150 MB。

《Alan Wake 2》也顯示出類似的結果。將 DLSS 4 升頻與幀生成配對時,VRAM 使用量減少了 100-150 MB。

有趣的是,《霍格華茲的傳承》在圖形記憶體消耗方面顯示出最大的改進。在使用 DLSS 在效能模式下進行幀生成時,在 4K「最大」設定下,VRAM 使用量從 14.74 GB 降至 14.22 GB(>500 MB)。
