
엔비디아 DLSS 4 “멀티 프레임 생성” 기술은 패스 트레이싱을 특징으로 하는 가장 까다로운 게임에서 성능을 최대 8배까지 향상시킵니다. 아직 자세한 내용은 베일에 싸여 있지만, 이 기술을 가능하게 하는 요소와 DLSS 3와의 차이점을 분석해 보았습니다. 요컨대, 엔비디아는 대부분의 신경망을 알고리즘의 품질과 성능을 향상시키는 업데이트되거나 개선된 AI 모델로 대체했습니다.
업데이트된 프레임 생성 AI 모델

DLSS 3 프레임 생성은 모션 벡터, 깊이, 지터 오프셋, 그리고 광학 흐름 가속기(Optical Flow Accelerator)의 광학 흐름 필드를 포함한 엔진 데이터를 활용하여 두 프레임 사이에 추가 프레임을 생성합니다. 이를 프레임 보간이라고 합니다. 보간된 프레임을 여러 개 생성하기 위해 이 프로세스를 여러 번 실행하는 것은 GPU의 속도를 저하시키므로 실현 불가능합니다.

DLSS 4 프레임 생성 모드는 40% 더 빠르고 VRAM을 30% 덜 사용합니다. 또한, 광학 흐름 가속기를 사용하지 않고도 한 번에 최대 3개의 프레임을 생성할 수 있습니다. 광학 흐름 필드는 AI 모델에 의해 생성되어 렌더링된 두 프레임마다 여러 프레임을 삽입할 수 있습니다.
하드웨어 플립 미터링 & 5세대 텐서 코어
하드웨어 플립 미터링: RTX 40 시리즈 GPU의 프레임 생성은 CPU 수준의 페이싱을 사용했습니다. 이는 프레임 간의 일관성 없는 프레임 페이싱으로 이어져, 일부 경우 불균일한 페이싱을 초래할 수 있습니다. 이는 높은 프레임 속도를 얻더라도 부드러움에 부정적인 영향을 미칠 수 있습니다.

블랙웰 GPU는 하드웨어 플립 미터링에 의존하며, 이는 대기 중인 프레임 처리를 GPU 디스플레이 엔진으로 오프로드합니다. 이를 통해 GPU는 프레임 표시 타이밍을 더욱 정밀하게 조정할 수 있습니다. 최적의 성능으로 이를 용이하게 하기 위해, 블랙웰의 디스플레이 엔진은 아다(Ada)보다 두 배 빠르며, DLSS 4와 함께 하드웨어 플립 미터링을 위한 더 높은 해상도와 주사율을 지원합니다: 4K에서 최대 480Hz 또는 8K에서 120Hz.
5세대 텐서 코어: DLSS 4는 업스케일링, 레이 재구성, 그리고 렌더링된 두 프레임 사이의 멀티 프레임 생성을 포함하여 5가지 AI 모델을 사용합니다. RTX 50 제품군은 이전 세대보다 2.5배 더 높은 처리량을 제공하는 5세대 텐서 코어를 활용합니다. 이는 더 낮은 정밀도의 FP4 측정 방식으로 전환함으로써 달성됩니다.
DLSS 트랜스포머 모델
DLSS 4는 널리 사용되는 CNN 모델을 트랜스포머 모델로 대체합니다. 이 비전 트랜스포머는 프레임 내의 다양한 픽셀과 여러 프레임에 걸쳐 상대적인 중요도를 평가하는 “셀프 어텐션” 연산을 특징으로 합니다. CNN보다 두 배 많은 데이터를 사용하여 트랜스포머 모델은 시간적 안정성을 향상시키고, 고스팅을 줄이며, 움직임에서 인지되는 디테일을 증가시킬 수 있습니다.

새로운 트랜스포머 모델은 CNN 모델을 특징으로 하는 게임과 호환되며 이달 말까지 제공될 예정입니다. 최신 모델로 업데이트되지 않은 타이틀은 엔비디아 앱을 통해 동일한 기능을 활용할 수 있습니다. 지원되는 앱의 “드라이버 설정” 에서 다음 옵션을 사용할 수 있습니다:

- 프레임 생성용 DLSS 오버라이드 – 게임 내에서 프레임 생성이 켜져 있을 때 GeForce RTX 50 시리즈 사용자에게 멀티 프레임 생성을 활성화합니다.
- 모델 프리셋용 DLSS 오버라이드 – 게임 내에서 DLSS가 켜져 있을 때 GeForce RTX 50 시리즈 및 GeForce RTX 40 시리즈 사용자에게 최신 프레임 생성 모델을, 모든 GeForce RTX 사용자에게 슈퍼 해상도 및 레이 재구성을 위한 트랜스포머 모델을 활성화합니다.
- 슈퍼 해상도용 DLSS 오버라이드 – 게임 내에서 슈퍼 해상도가 켜져 있을 때 DLSS 슈퍼 해상도의 내부 렌더링 해상도를 설정하여 DLAA 또는 Ultra 성능 모드를 활성화합니다.