
NVIDIA는 이달 초 CES에서 GeForce RTX 50 시리즈 “블랙웰” GPU와 함께 DLSS 4를 발표했습니다. 멀티 프레임 생성(MFG)은 RTX 5090 및 그 형제 모델에만 독점 제공되지만, 개선된 업스케일링은 모든 RTX GPU에 적용됩니다. CNN에서 트랜스포머 기반 신경망으로의 전환은 더 선명한 이미지를 제공하며, 프레임 전반에 걸쳐 더 많은 디테일과 레이 트레이싱 조명 샘플을 유지합니다. 업그레이드된 프레임 생성 모델은 더 빠르고 기존 구현보다 VRAM을 30% 덜 사용합니다.
추가 자료:
DLSS 4 vs. DLSS 3: 트랜스포머 vs. CNN

DLSS 3 및 2는 컨볼루션 신경망(CNN)을 활용하며, 이는 이미지 전반에 걸쳐 가장자리, 모양, 색상, 질감, 깊이 등 패턴(또는 패치)을 식별하여 작동합니다. 각 패턴에 대한 특징 맵이 형성되고, 서로 학습함으로써 복잡한 기하학적 구조를 인식할 수 있는 복잡한 맵을 형성합니다. 모션 벡터는 프레임 전반에 걸쳐 이러한 패턴을 추적하는 데 도움이 되며, 고해상도 프레임은 저해상도 입력을 이전에 렌더링된 고해상도 프레임과 비교하여 구성됩니다.
DLSS 4는 CNN을 자기 주의 연산이 가능한 트랜스포머 기반 모델로 대체합니다. 이를 통해 모델은 여러 프레임에 걸쳐 각 픽셀(또는 패턴)의 중요성을 결정할 수 있습니다. 결과 이미지는 더 안정적이고 세부적이며, 고스팅 및 모션에서의 앨리어싱이 감소합니다. 업스케일링 품질 향상 외에도 트랜스포머 모델은 특히 반사 및 확산 조명과 관련하여 우수한 레이 트레이싱 출력을 생성합니다.
DLSS 4 vs. DLSS 3 이미지 비교
Cyberpunk 2077, Alan Wake 2, Hogwarts Legacy에서 DLSS 4와 트랜스포머 모델을 테스트했습니다. DLSS 3.7에 비해 특히 얇고 복잡한 기하학적 구조, 확산 그림자, 반사에서 상당한 이미지 품질 향상이 있습니다. 아래 모든 비교는 패스 트레이싱과 DLSS를 “성능 모드” 로 설정한 4K에서 이루어졌습니다. 이미지를 클릭하면 확대됩니다.
DLSS 4 vs. DLSS 3: 그림자 기하학적 디테일


(슬라이더 비교)
위 두 장면의 차이는 명확합니다. DLSS 4의 트랜스포머 모델은 복잡한 기하학적 및 조명 디테일을 훨씬 더 잘 유지합니다. 가장 분명한 것은 햇빛이 비치는 저녁의 특징인 분홍빛 색조의 유지입니다. 틈새, 경계 및 움푹 들어간 곳을 따라 있는 주변 그림자도 더 세부적입니다.


위 2배 확대는 DLSS 4의 트랜스포머 모델이 철망 울타리와 같이 얇고 정교한 개체에 대해 얼마나 더 정확한지 보여줍니다. 질감은 더 세부적이며(흐릿하지 않음), 배경에 정확하게 그림자를 드리웁니다.


이에 비해 FSR 3 및 XeSS 2는 완전히 엉망이며, 중앙 근처의 많은 디테일을 잃고 주변 그림자 및 주변 폐색을 놓칩니다.


(슬라이더 비교)
위 비교는 두 업스케일링 모델의 주변 폐색 또는 확산 그림자 품질의 엄청난 차이를 강조합니다. DLSS 4의 트랜스포머 모델은 밝은 대낮에도 주변 그림자를 정확하게 렌더링하는 반면, DLSS 3는 간접 조명으로 인해 대부분의 그림자를 잃습니다. 마찬가지로 FSR 3 및 XeSS 2는 그림자의 상당 부분을 놓쳐 앨리어싱된 울타리를 생성합니다. DLSS 4는 다른 모델들이 놓치는 배선에 그림자를 미묘하게 유지합니다.


아래 비교는 다리 바닥을 따라 개선된 디테일 유지와 DLSS 4를 사용한 흐림/번짐의 상당한 감소를 강조합니다. 야자수는 더 균일하게 그림자가 드리워져 중앙 근처에는 더 짙은 그림자를 드리우고 상단에는 더 밝게 조명됩니다.


(슬라이더 비교)
FSR 3 및 XeSS 2로 업스케일링된 이미지는 과도한 선명화로 인해 상당히 노이즈가 많고 장면 전체에 걸쳐 많은 색상과 그림자를 잃습니다.


DLSS 4 vs. DLSS 3: 조명 반사
DLSS 4와 트랜스포머 모델은 반사 조명 또는 반사에 놀라운 효과를 줍니다. 반사가 더 선명할 뿐만 아니라, 멀리 있는 개체와 관련된 더 많은 디테일을 유지하며, 반사 표면은 장면에서 빛을 정확하게 산란합니다. 이는 결과적으로 전역 조명을 향상시켜 정확한 그림자와 세부적인 반사를 생성합니다(화분 참조).


(슬라이더 비교)
FSR 3 및 XeSS는 흐릿한 반사를 생성하지만, 다른 측면에서는 DLSS 3.7보다 훨씬 나쁘지 않습니다. 반사 표면은 비슷하게 처리됩니다.


다음은 DLSS 4가 DLSS 3.7 및 FSR 3보다 반사 및 조명을 어떻게 향상시키는지 보여주는 또 다른 예입니다. 노이즈 감소, 원거리 개체 커버리지, 우수한 색상 흡수는 주목할 만합니다.



(슬라이더 비교)
- 사이버펑크 2077
DLSS 4 vs. DLSS 3: 앨런 웨이크 2
앨런 웨이크 2는 새로운 구현 대신 FSR 2를 활용합니다. 따라서 그래픽 설정을 최대로 하고 업스케일링 프리셋을 성능으로 설정한 상태에서 DLSS 3와 4의 비교로 제한하겠습니다.


(슬라이더 비교)
이미지를 확대하면 몇 가지 주요 차이점이 드러납니다. 우선, DLSS 4는 장면 전체에 만연한 다채로운 조명의 더 길고 완전한 반사를 렌더링합니다. 빛은 밀폐된 표면과 멀리 떨어진 표면을 따라 철저히 산란되며, 더 멀리 있는 광원도 근처의 (확산) 조명에 기여합니다. 마지막으로, 빗방울(오른쪽 상단)은 DLSS 3를 사용하면 유지되지 않습니다. DLSS 4는 동일한 오류를 범하지 않습니다.


(슬라이더 비교)
위는 DLSS 4가 더 정확한 확산 “부드러운” 그림자를 렌더링하는 좋은 예이며, DLSS 3는 경계 주변에 노이즈가 있는 흐릿한 실루엣을 생성합니다. 소파, 기둥, 책상이 드리우는 그림자에 주목하십시오. 트랜스포머 모델은 그림자 노이즈를 제거하고 타일 사이의 움푹 들어간 곳을 비추는 확산 조명을 유지합니다. 이상하게도 타일 패턴도 흐리게 만듭니다.
- 앨런 웨이크 2
DLSS 4 vs. DLSS 3: 호그와트 레거시
호그와트 레거시는 레이 트레이싱된 그림자, 반사 및 주변 폐색만 제공합니다. 어쩐지 패스 트레이싱이 적용된 사이버펑크 2077보다 성능이 더 나쁩니다. 아래 예시는 DLSS 4가 나뭇가지의 미세한 끝 부분에서 디테일 유지를 어떻게 개선하는지 보여줍니다.


(슬라이더 비교)
차이점은 비교적 미묘하지만, DLSS 4가 네이티브 4K보다 더 많은 디테일을 유지한다는 것을 알 수 있습니다. 1080p 입력을 거의 두 배의 프레임 속도로 받아들여 더 높은 품질의 4K 이미지를 렌더링하는 것입니다.



아래는 DLSS 3가 네이티브 해상도에서 보이는 확산 그림자 중 일부를 어떻게 잃는지 보여주는 훌륭한 예입니다(지붕 참조). DLSS 4는 이러한 그림자를 유지할 뿐만 아니라 가로등 주변의 조명 디테일을 개선하여 네이티브보다 한 수 위입니다.



(슬라이더 비교)
“그레이트 홀” 의 아래 비교는 레이 트레이싱된 반사에 대한 개선 사항을 강조합니다. DLSS 4의 트랜스포머 모델은 우수한 노이즈 제거(레이 재구성)로 인해 더 선명하고 사실적인 반사를 생성합니다. 이는 반사 주변의 확산 반사를 유발하며, 표면 디테일이 더 높은 정도로 유지됩니다.


(슬라이더 비교)
네이티브 렌더링은 레이 재구성을 사용하는 트랜스포머 업스케일링 모델만큼 반사를 노이즈 제거하지 못합니다. 그럼에도 불구하고, 구형 CNN 모델은 네이티브와 유사한 품질을 생성하는 반면, FSR 및 XeSS는 뒤처집니다.


- 호그와트 레거시
DLSS 3 vs. DLSS 4 프레임 생성: VRAM 사용량
DLSS 4 사용 시 성능 향상이 있는지 확인하기 위해 GeForce RTX 4090에서 세 가지 게임을 벤치마킹했습니다. 성능 향상은 없지만, 업데이트된 모델을 사용하면 VRAM 사용량이 약간 감소합니다. Cyberpunk 2077은 DLAA 및 프레임 생성을 사용하여 4K “최대” 에서 300MB 이상 감소합니다. 업스케일링을 활성화하면 그래픽 메모리 소비가 100-150MB 감소합니다.

앨런 웨이크 2도 비슷한 결과를 보입니다. DLSS 4 업스케일링과 프레임 생성을 함께 사용하면 VRAM 사용량이 100-150MB 감소합니다.

흥미롭게도 호그와트 레거시는 그래픽 메모리 소비에서 가장 큰 개선을 보입니다. 프레임 생성을 사용하여 성능 모드에서 DLSS를 사용하면 4K “최대” 에서 VRAM 사용량이 14.74GB에서 14.22GB(>500MB)로 감소합니다.
