
NVIDIAは今月初めのCESで、GeForce RTX 50シリーズ「Blackwell」GPUと並行してDLSS 4を発表しました。マルチフレーム生成(MFG)はRTX 5090とその兄弟モデルに限定されますが、改良されたアップスケーリングはすべてのRTX GPUに提供されます。CNNからTransformerベースのニューラルネットワークへの移行により、よりシャープな画像が実現し、フレーム全体でより多くのディテールとレイトレースされたライティングサンプルが保持されます。アップグレードされたフレーム生成モデルは高速で、既存の実装よりも30%少ないVRAMを使用します。
さらに読む:
DLSS 4 vs. DLSS 3:Transformer vs. CNN

DLSS 3と2は、エッジ、形状、色、テクスチャ、深度など、画像全体のパターン(またはパッチ)を識別することで機能する畳み込みニューラルネットワーク(CNN)を活用しています。各パターンに対して特徴マップが形成され、互いに学習することで、複雑なジオメトリを認識できる複雑なマップを形成します。モーションベクトルは、これらのパターンをフレーム間で追跡するのに役立ち、低解像度の入力を以前にレンダリングされた高解像度フレームと比較することで、高解像度フレームが構築されます。
DLSS 4はCNNをTransformerベースのモデルに置き換え、自己注意操作が可能です。これにより、モデルは複数のフレームにわたる各ピクセル(またはパターン)の重要性を判断できます。結果として得られる画像はより安定し、モーション中のゴーストやエイリアシングが軽減され、詳細が向上します。アップスケーリング品質の向上に加えて、Transformerモデルは特に反射や拡散照明に関して、優れたレイトレース出力を生成します。
DLSS 4 vs. DLSS 3 画像比較
Cyberpunk 2077、Alan Wake 2、Hogwarts LegacyでDLSS 4とそのTransformerモデルをテストしました。主に薄く複雑なジオメトリ、拡散シャドウ、反射において、DLSS 3.7と比較して大幅な画質向上が見られます。以下の比較はすべて、パス・トレーシングとDLSSを「パフォーマンスモード」に設定した4Kで行われました。画像を拡大するには、画像をクリックしてください。
DLSS 4 vs. DLSS 3:シャドウ & ジオメトリの詳細


(スライダー比較)
上記の2つのショットの違いは一目瞭然です。DLSS 4のTransformerモデルは、複雑な幾何学的および照明の詳細を保持するのに非常に優れています。最も明白なのは、夕日の特徴であるピンクがかった色合いの保持です。隙間、境界、くぼみに沿ったアンビエントシャドウもより詳細です。


上記の2倍のクローズアップは、DLSS 4のTransformerモデルがワイヤーフェンスのような薄くて精巧なオブジェクトに対してどれほど正確であるかを示しています。テクスチャはより詳細で(ぼやけておらず)、背景に正確に影を落としています。


比較すると、FSR 3とXeSS 2は完全に混乱しており、中央付近の多くの詳細を失い、周囲の影やアンビエントオクルージョンが欠落しています。


(スライダー比較)
上記の比較は、2つのアップスケーリングモデルにおけるアンビエントオクルージョン、つまり拡散シャドウの品質における大きな違いを浮き彫りにしています。DLSS 4のTransformerモデルは、明るい日中のアンビエントシャドウを正確にレンダリングしますが、DLSS 3はそれらのほとんどを失い、間接照明によって洗い流されている可能性があります。同様に、FSR 3とXeSS 2はシャドウの多くが欠落しており、エイリアシングされたフェンスを生成します。DLSS 4は、他のモデルでは見逃されがちな配線のシャドウを微妙に保持しています。


以下の比較は、橋の基部のディテール保持の改善と、DLSS 4によるぼやけ/にじみの大幅な軽減を浮き彫りにしています。ヤシの木はより均一に影が落ちており、中央付近ではより濃い影を落とし、上部ではより明るく照らされています。


(スライダー比較)
FSR 3とXeSS 2によってアップスケールされた画像は、過度のシャープ化によりかなりノイズが多く、シーン全体で多くの色とシャドウを失っています。


DLSS 4 vs. DLSS 3:ライティング & 反射
DLSS 4とそのTransformerモデルは、スペキュラーライティングや反射に驚くべき効果をもたらします。反射がより鮮明になるだけでなく、遠くのオブジェクトに関する詳細をより多く保持し、スペキュラーな表面がシーン内で光を正確に散乱させます。これにより、グローバルイルミネーションが強化され、正確なシャドウと詳細な反射が生成されます(プランターを参照)。


(スライダー比較)
FSR 3とXeSSはぼやけた反射を生成しますが、他の点ではDLSS 3.7とそれほど変わりません。スペキュラーな表面は同様に処理されます。


DLSS 4がDLSS 3.7およびFSR 3と比較して、スペキュラー反射とライティングをどのように強化するかを示す別の例を以下に示します。ノイズの低減、遠距離オブジェクトのカバレッジ、および優れた色吸収に注目する価値があります。



(スライダー比較)
- サイバーパンク2077
DLSS 4 vs. DLSS 3: Alan Wake 2
Alan Wake 2は、新しい実装ではなくFSR 2を活用しています。したがって、比較はDLSS 3と4に限定し、グラフィック設定を最大にし、アップスケーリングプリセットをパフォーマンスに設定します。


(スライダー比較)
画像を拡大すると、いくつかの重要な違いが明らかになります。まず、DLSS 4は、シーン全体に広がるカラフルな照明の、より長く、より完全な反射をレンダリングします。光は、閉鎖された遠くの表面に徹底的に散乱し、さらに遠くの光源も近くの(拡散)照明に寄与しています。最後に、雨粒(右上)はDLSS 3では保持されません。DLSS 4は同じエラーを犯しません。


(スライダー比較)
上記は、DLSS 4がより正確な拡散「ソフト」なシャドウをどのようにレンダリングするかを示す良い例です。一方、DLSS 3は境界線にノイズのあるぼやけたシルエットになります。ソファ、柱、机によって落とされたシャドウに注目してください。Transformerモデルはシャドウノイズを除去し、タイル間のくぼみを照らす拡散照明を保持します。奇妙なことに、タイルのパターンもぼやけています。
- アラン・ウェイク2
DLSS 4 vs. DLSS 3: ホグワーツ・レガシー
ホグワーツ・レガシーは、レイトレースされたシャドウ、反射、アンビエントオクルージョンのみを特徴としています。なぜか、パス・トレーシングを使用したCyberpunk 2077よりも動作が遅いです。以下の例は、DLSS 4が木の枝のより細かい部分のディテール保持をどのように改善するかを示しています。


(スライダー比較)
違いは比較的小さいですが、DLSS 4がネイティブ4Kよりも多くのディテールを保持していることがわかります。1080pの入力をほぼ2倍のフレームレートで取り込むことで、より高品質な4K画像をレンダリングしています。



以下は、DLSS 3がネイティブ解像度で表示される拡散シャドウの一部(屋根を参照)をどのように失うかを示す優れた例です。DLSS 4はこれらのシャドウを保持するだけでなく、街灯上およびその周囲の照明の詳細を改善することで、ネイティブを上回っています。



(スライダー比較)
「大広間」からの以下の比較は、レイトレースされた反射の改善を浮き彫りにしています。DLSS 4のTransformerモデルは、優れたデノイズ(レイ再構築)により、より鮮明でリアルな反射を生成します。これにより、スペキュラーな反射の周囲に拡散反射が生じ、表面の詳細がより高いレベルで保持されます。


(スライダー比較)
ネイティブレンダリングは、レイ再構築を備えたTransformerアップスケーリングモデルと同じ程度に反射をデノイズできません。それにもかかわらず、古いCNNモデルはネイティブと同様の品質を生成しますが、FSRとXeSSは遅れをとっています。


- ホグワーツ・レガシー
DLSS 3 vs. DLSS 4 フレーム生成:VRAM使用量
DLSS 4を使用した場合のパフォーマンス向上があるかを確認するため、GeForce RTX 4090で3つのゲームをベンチマークしました。パフォーマンスの向上はありませんでしたが、更新されたモデルを使用するとVRAM使用量がわずかに減少しました。Cyberpunk 2077では、DLAAとフレーム生成を使用して4K「Max」で300MB以上の減少が見られました。アップスケーリングを有効にすると、グラフィックメモリ消費量が100〜150MB減少します。

Alan Wake 2も同様の結果を示しています。DLSS 4アップスケーリングとフレーム生成を組み合わせると、VRAM使用量が100〜150MB減少します。

興味深いことに、Hogwarts Legacyはグラフィックメモリ消費量において最大の改善を示しています。VRAM使用量は14.74 GBから14.22 GB(>500 MB)に減少します。4K「最大」設定でDLSSをパフォーマンスモードでフレーム生成と共に使用した場合。
