2024-01-31
降價至 US$999 的 SUPER
NVIDIA GeForce RTX 4080 SUPER FE 實測
文: John Lam / 評測中心


NVIDIA RTX 40 SUPER 三部曲 !! 緊接登場是 GeForce RTX 4080 SUPER 顯示卡正式登場,升級至 AD103-400 繪圖核心,CUDA Cores 增量至 10,240 個,GDDR6X 記憶體速度提升至 23Gbps,更重要是 MSPR 定價由 US$1,199 降至 US$999。HKEPC 編輯部找來了 GeForce RTX 4080 SUPER Founder Edition 顯示卡,與 RTX 4080 及 RTX 4090 作對比測試。



效能測試︰

 

RTX 4080 SUPER

 

 

HKEPC 編輯部收到由 NVIDIA 送測 GeForce RTX 4080 SUPER FE 顯示卡樣本,同時亦找來 RTX 4080 / RTX 4090 作對比測試,以了解這 NVIDIA GeForce RTX 4080 SUPER 的效能水平。

 

 

RTX 4080 SUPERRTX 4080 SUPER

 

 

時脈方面,NVIDIA GeForce RTX 4080 SUPER FE 預設核心時脈為 2,295MHz Base Clock、2,550MHz Boost Clock,支援 GPU Boost 4.0 技術最高可達 2,870MHz,最高 Power Limit 預設為 320W,可在 -55% 至 +11% 作出調整,最高可調至 355W。

 

 

RTX 4080 SUPER

▲ Furmark 2 測試最高溫度 62°C

 

 

散熱方面,NVIDIA GeForce RTX 4070 SUPER FE 在約 21°C 的室溫環境下閒置約 30分鐘,GPU溫度維持在 36°C。接著採用 Furmark 進行 3D 負載測試,將 GPU 完全負載 30 分鐘後,溫度會提升至62°C,GPU 時脈保持在 2,325MHz,TGP 為 320W。

 

 

測試平台︰

 

Intel Core i9-12900K CPU 

ASUS ROG Z790 Maximus APEX

ANACOMDA DDR5-6400 CL36-38-38-68 32GB x 2 @1.35V

Windows 11 Professional 23H2

NVIDIA GeForce Driver 551.22 WHQL

 

 

RTX 4080 SUPER

 

 

 

RTX 4080 SUPER

 

 

 

RTX 4080 SUPER

 

 

RTX 4080 SUPER

 

 

RTX 4080 SUPER

 

 

3DMark Ray-Tracing 測試︰

 

 

RTX 4080 SUPER

 

 

RTX 4080 SUPER

 

 

 

3DMark DLSS 測試︰

 

RTX 4080 SUPER

 

 

 

3DMark DirectX Raytracing feature test 測試

 

 RTX 4080 SUPER

 

 

 

遊戲效能測試:

 

以下的遊戲測試除另外指明外,全部皆以 3840 x 2160 解析度全屏幕執行,畫質皆設定為最高品質,若遊戲支援光線追蹤技術則同時將光追品質全開。而 DLSS 方面則統一使用 Performance 設定,當中 GeForce RTX 40 系列會啟用 DLSS 3 中新增的 Frame Generation 技術。

 

 

A Plague Tale:Requiem 瘟疫傳說:安魂曲 (RT + DLSS 3)

 

 

 

Control (RT + DLSS2)

 

 

 

CyberPunk 2077 RT Ultra (RT+ DLSS 3)

 

 

 

F1 22 (RT + DLSS 3)

 

 

 

Forza Horizon 5 (DLSS 3)

 

 

 

Tom Clancy's Rainbow Six Siege 虹彩六號:圍攻行動

 

 

 

Microsoft Flight Simulator 微軟模擬飛行 (DLSS 3)

 

 

 

Watch Dogs Legion (RT + DLSS)

 

 

 

UL Procyon AI 測試

 

 

RTX 4080 SUPER

 

 

RTX 4080 SUPER

 

 

 

在 UL Procyon AI Inference Benchmark (Windows) AI 推理基準測試中,使用常見的電腦視覺的神經網絡模型,透過 CPU 或 GPU 運行相同操作進行比較,以測量 AI 加速器的性能,並設有浮點數或整數的測試方式。

 

測試採用 14900K、RTX 4080 / RTX 4080 SUPER 配置、float32 精度。在 Microsoft Windows ML 版本及 NVIDIA Tensor RT 版本中,RTX 4070 Ti SUPER 分別獲得 1,204 和 1,694 分數,而 RTX 4080 分別獲得 1,199 和 1,682 分數。AI 運算性能跑分方面,RTX 4080 與 RTX 4080 SUPER 非常接近。

 

 

Stable Diffusion AI 生成應用測試

 

 ROG Strix RTX 4090 OC EVA-02

 

 

Stable Diffusion 是於 2022 年發佈的深度學習 text-to-image 模型工具,只需要輸入文字內容,配合含有大量素材的訓練模型,便可即時繪畫(AI 生成)圖像。透過不同的文字內容和特定主題的訓練模型,Stable Diffusion 主要用於生成真實人像、二次元人像、不同藝術風格等圖像類型,帶來千變萬化、創意無限的圖片內容,更是現時 2023 年熱門使用的 AI 創作工具。

 

 

RTX 4080 SUPER

 

 

Stable Diffusion 支援 WebUI 介面,可在瀏覽器中顯示圖形化界面,能讓一般電腦用家也能輕鬆使用及調整不同的選項,亦相容不同的系統平台及電腦硬件,加上不是太過複雜的安裝過程,深受不同程度的電腦用家歡迎。不過 Stable Diffusion 對於電腦硬件中的 GPU VRAM 容量有一定的需求,太低 VRAM 容量將會影響圖片生成時的速度或是生成變化,普遍建議使用 8GB VRAM 容量或以上的顯示卡。

 

 

 

 

在不超過 8GB VRAM 容量下,RTX 4080 SUPER 完成時間為 8.9 秒,而 RTX 4080 為 9.1秒,兩者相差 0.2 秒。少許規格提升的 RTX 4080 SUPER 在低需求的 AI 圖像生成只有非常輕微的差異。

 

 

RTX 4080 SUPER

RTX 4080 SUPER

 

NVIDIA 於 2023 年 11 月推出全新 TensorRT Extension 工具,適用於 Stable Diffusion WebUI 安裝及使用的擴充插件。TensorRT Extension 可把一般的 Checkpoint 或 LoRA等模型,轉換到 TensorRT 格式的設定檔,並可自訂設定檔的數值設定,目前支援 Text-2-image、Image-2-image、Stable Diffusion 1.5 / 2.1 / XL、LoRA 等。NVIVIDA 表示運行 TensorRT Extension 時,將會使用 NVIDIA GPU 的 Tensor Core 計算,Stable Diffusion 的效能可提升 1 倍以上。

 

RTX 4080 SUPER

 

測試使用 Stable Diffusuion 模組的 SDXL Turbo 1.0,並使用 TensorRT Extension 工具,轉換合適的設定置。以 1024x1024 解析度、Step 20、Batch count 1、Batch size 1、簡單的提示詞等設定運行,並分別開啟或關閉 xformers 指令、開啟或關閉 TensorRT 功能。

 

RTX 4080 SUPER

 

在運行 SDXL Turbo 模式時,預載時已超過 8GB VRAM 容量,以 1024x1024 解析度算圖時,更會超出 12GB 或以上 VRAM 容量。在 PyTorch、PyTorch + xformers、TensorRT 框架運算下,RTX 4080 SUPER 16GB 完成時間為 6.4 秒、5.1 秒、3.9 秒,而 RTX 4080 16GB 完成時間分別為 6.9 秒、5.5 秒、4.4 秒,兩者時間相差 7% ~ 12%。相比 RTX 4080 16GB,當場景變得越複雜 RTX 4080 SUPER 16GB 才會有更明顯的性能差異。

 

在使用 Stable Diffusion 高需求模組並以高解析度運行時,所需的 VRAM 容量隨即增加,在使用 xformers 指令後,雖然完成時間減少了,但 VRAM 容量佔用反而更多,失去了原來減少 VRAM 佔用的優點。在使用 TensorRT 框架後,相比純 PyTorch 運算,VRAM 容量佔用明顯降低,而且縮減了 50% ~ 60% 完成時間,對於 AI 生成圖片更有幫助。

 

 

編輯評語︰

 

雖然 GeForce RTX 4080 SUPER 在晶片規模增加了 5.28%、記憶體頻寬增加了 2.68%,但在 3D 遊戲運算下你並不可能每次都將運算單元 100% 填滿,所以 GeForce RTX 4080 SUPER 實際的遊戲性能提升只有 1~3% 不等,越高解析度、越複雜的場景差異才會較為明顯,所以 RTX 4080 SUPER 的重點並不在於規格及性能上的提升,而是 MSPR 定價由 US$1,199 降至 US$999。

 

其實大家也不必將 RTX 4080 SUPER 與 RTX 4080 作過多的比較,就當作是一樣的東西好了,反正 NVIDIA 已經將 RTX 4080 停產,其地位由 RTX 4080 SUPER 取而代之。

發表評論