新聞

推動 NVIDIA DLSS 4 的 4 項技術「多幀生成」

NVIDIA 的 DLSS 4「多幀生成」技術在支援路徑追蹤的最嚴苛遊戲中,效能提升高達 8 倍。雖然更精細的細節仍未公開,但以下是實現此壯舉的原因以及它與 DLSS 3 的不同之處。簡而言之,NVIDIA 已將其大部分神經網路替換為更新或改進的 AI 模型,從而提高了演算法的品質和效能。

更新的幀生成 AI 模型

DLSS 3 幀生成 利用引擎資料,包括運動向量、深度、抖動偏移以及來自光流加速器的光流場,在每兩幀之間生成額外的一幀。這稱為 幀插值。多次執行此過程以生成多個插值幀是不可行的,因為這會減慢 GPU 的速度。

DLSS 4 幀生成 模式速度提升 40%,VRAM 使用量減少 30%。此外,它一次最多可生成 3 幀,而無需呼叫光流加速器。光流場由 AI 模型生成,允許在每兩幀渲染幀之間插入多個幀。

硬體翻轉測量與第 5 代 Tensor 核心

硬體翻轉測量: RTX 40 系列 GPU 上的幀生成使用 CPU 等級 的步調,這可能導致幀之間步調不一致,在某些情況下導致步調不均勻。即使您獲得高幀率,這也可能對流暢度產生不利影響。

Blackwell GPU 依賴硬體翻轉測量,將排隊的幀處理卸載到 GPU 顯示引擎。這允許 GPU 以更高的精度調整幀顯示時間。為了以最佳效能促進這一點,Blackwell 的顯示引擎比 Ada 快兩倍,以支援更高的解析度和刷新率,用於 DLSS 4 的硬體翻轉測量:高達 4K 480Hz 或 8K 120Hz。

第 5 代 Tensor 核心: DLSS 4 採用 5 個 AI 模型,包括升級、光線重建和每兩幀渲染幀之間的多幀生成。RTX 50 系列利用第 5 代 Tensor 核心,其吞吐量比前代產品高 2.5 倍。這是透過切換到較低精度的 FP4 指標實現的。

DLSS 變壓器模型

DLSS 4 以變壓器模型取代了廣泛使用的 CNN 模型。此視覺變壓器具有「自我注意力」操作,可評估幀內和多幀之間不同像素的相對重要性。使用兩倍於 CNN 的資料,變壓器模型可提高時間 穩定性、減少 重影,並增加運動中感知的 細節

較新的變壓器模型與採用 CNN 模型的遊戲相容,並將於 本月底 上市。尚未更新到最新模型的遊戲可透過 NVIDIA 應用程式使用相同的功能。支援的應用程式將在「驅動程式設定」下提供以下選項:

  • DLSS 幀生成覆寫 – 在遊戲中開啟幀生成時,為 GeForce RTX 50 系列使用者啟用多幀生成。
  • DLSS 模型預設覆寫 – 在遊戲中開啟 DLSS 時,為 GeForce RTX 50 系列和 GeForce RTX 40 系列使用者啟用最新的幀生成模型,並為所有 GeForce RTX 使用者啟用超級解析度和光線重建的變壓器模型。
  • DLSS 超級解析度覆寫 – 設定 DLSS 超級解析度的內部渲染解析度,在遊戲中開啟超級解析度時啟用 DLAA 或 Ultra 效能模式。

Areej Syed

Processors, PC gaming, and the past. I have been writing about computer hardware for over seven years with more than 5000 published articles. Started off during engineering college and haven't stopped since. Find me at HardwareTimes and PC Opset.
Back to top button