
NVIDIA 的 DLSS 4「多幀生成」技術在支援路徑追蹤的最嚴苛遊戲中,效能提升高達 8 倍。雖然更精細的細節仍未公開,但以下是實現此壯舉的原因以及它與 DLSS 3 的不同之處。簡而言之,NVIDIA 已將其大部分神經網路替換為更新或改進的 AI 模型,從而提高了演算法的品質和效能。
更新的幀生成 AI 模型

DLSS 3 幀生成 利用引擎資料,包括運動向量、深度、抖動偏移以及來自光流加速器的光流場,在每兩幀之間生成額外的一幀。這稱為 幀插值。多次執行此過程以生成多個插值幀是不可行的,因為這會減慢 GPU 的速度。

DLSS 4 幀生成 模式速度提升 40%,VRAM 使用量減少 30%。此外,它一次最多可生成 3 幀,而無需呼叫光流加速器。光流場由 AI 模型生成,允許在每兩幀渲染幀之間插入多個幀。
硬體翻轉測量與第 5 代 Tensor 核心
硬體翻轉測量: RTX 40 系列 GPU 上的幀生成使用 CPU 等級 的步調,這可能導致幀之間步調不一致,在某些情況下導致步調不均勻。即使您獲得高幀率,這也可能對流暢度產生不利影響。

Blackwell GPU 依賴硬體翻轉測量,將排隊的幀處理卸載到 GPU 顯示引擎。這允許 GPU 以更高的精度調整幀顯示時間。為了以最佳效能促進這一點,Blackwell 的顯示引擎比 Ada 快兩倍,以支援更高的解析度和刷新率,用於 DLSS 4 的硬體翻轉測量:高達 4K 480Hz 或 8K 120Hz。
第 5 代 Tensor 核心: DLSS 4 採用 5 個 AI 模型,包括升級、光線重建和每兩幀渲染幀之間的多幀生成。RTX 50 系列利用第 5 代 Tensor 核心,其吞吐量比前代產品高 2.5 倍。這是透過切換到較低精度的 FP4 指標實現的。
DLSS 變壓器模型
DLSS 4 以變壓器模型取代了廣泛使用的 CNN 模型。此視覺變壓器具有「自我注意力」操作,可評估幀內和多幀之間不同像素的相對重要性。使用兩倍於 CNN 的資料,變壓器模型可提高時間 穩定性、減少 重影,並增加運動中感知的 細節。

較新的變壓器模型與採用 CNN 模型的遊戲相容,並將於 本月底 上市。尚未更新到最新模型的遊戲可透過 NVIDIA 應用程式使用相同的功能。支援的應用程式將在「驅動程式設定」下提供以下選項:

- DLSS 幀生成覆寫 – 在遊戲中開啟幀生成時,為 GeForce RTX 50 系列使用者啟用多幀生成。
- DLSS 模型預設覆寫 – 在遊戲中開啟 DLSS 時,為 GeForce RTX 50 系列和 GeForce RTX 40 系列使用者啟用最新的幀生成模型,並為所有 GeForce RTX 使用者啟用超級解析度和光線重建的變壓器模型。
- DLSS 超級解析度覆寫 – 設定 DLSS 超級解析度的內部渲染解析度,在遊戲中開啟超級解析度時啟用 DLAA 或 Ultra 效能模式。