NVIDIA RTX 40 SUPER 三部曲 !! 緊接登場是 GeForce RTX 4080 SUPER 顯示卡正式登場,升級至 AD103-400 繪圖核心,CUDA Cores 增量至 10,240 個,GDDR6X 記憶體速度提升至 23Gbps,更重要是 MSPR 定價由 US$1,199 降至 US$999。HKEPC 編輯部找來了 GeForce RTX 4080 SUPER Founder Edition 顯示卡,與 RTX 4080 及 RTX 4090 作對比測試。
RTX 40 SUPER 第三炮 : 4080 SUPER
NVIDIA 31 日正式發布全新高階 GeForce RTX 4080 SUPER 顯示卡,這是 RTX 40 SUPER 三部曲的最終章,規格上 RTX 4080 SUPER 與 RTX 4080 差異較少,CUDA Cores 數目提升了 5.27%,記憶體介面與容量不變,記憶體顆粒時脈提升約 2.68%,因此不要期待 RTX 4080 SUPER 性能會比 RTX 4080 快多少,不過 NVIDIA 正式RTX 4080 SUPER 的 MSRP 售價由 US$1,199 降至 US$999,售價才是它的賣點。
有人說老黃的刀法越來越離譜,或許是 AMD 與 Intel 都太弱了令 NVIDIA 無所顧忌,但數據卻是騙不了人,對比 RTX 20、RTX 30 與 RTX 40 世代的晶片規格,中高階型號的晶片規格與 Full Chip 的差異越來越大,玩家們批評 RTX 40 中高階型號性價比欠奉、吸引力很低。
GeForce RTX 4080 型號真的是毫無性價比可言,RTX 4080 晶片規模只有 RTX 4090 的 59.38%,但售價僅便宜 US$400,對比 RTX 3080 晶片規模是 RTX 3090 的 82.96%,售價便宜 US$800,難怪大家都說︰「畀多少少錢,買 RTX 4090 好過啦」。
撥亂反正的 RTX 40 SUPER
對於 NVIDIA 來說 RTX 40 SUPER 是一個大升級,但筆者認為用「撥亂反正」來形容會更貼切,NVIDIA 將會推出三款全新 RTX 40 SUPER 型號,包括 GeForce RTX 4070 SUPER、GeForce RTX 4070 TI SUPER 及 GeForce RTX 4080 SUPER,其中 RTX 4070 Ti SUPER 與 RTX 4080 SUPER 會取代舊型號,RTX 4070 Ti 及 RTX 4080 將完全停產,RTX 4080 SUPER 的 MSRP 定價會降至 US$999。
作為 NVIDIA RTX 40 SUPER 三部曲的最終章,GeForce RTX 4080 SUPER 規格是提升幅度最少的一張,CUDA Core 只增加了 5.27%、仍然只有 AD102 Full Chip 規格的 55.56%,記憶體介面和容量不變,記憶體顆粒時脈提升約 2.68%,因此不要期待 RTX 4080 SUPER 性能會比 RTX 4080 快多少,實際意義在於將 RTX 40 售價差距作出修正,向下調 US$200 後 MSPR 定於 US$999 水平,令整個 NVIDIA RTX 40 產品線佈局變得較為合理。
NVIDIA AD103-400 繪圖核心
與 RTX 4070 Ti SUPER / RTX 4080 一樣,GeForce RTX 4080 SUPER 同樣採用 AD103 繪圖核心,基於 NVIDIA Ada Lovelace GPU 微架構,性能提升主要來自 FP32 運算單元數目及時脈倍增,更大的 L2 Cache 容量及全新著色器執行排序技術,升級第 3 代 RT Cores、升級第 4 代 Tensor Cores,與上代比較 Ampere GPU 微架構比較,傳統光柵圖形運算提高了 2 倍,同時在光線追蹤性能上提升近 4 倍。
▲ NVIDIA AD103-400 Block Diagram
GeForce RTX 4080 SUPER 採用完整的 AD103-400 繪圖核心,採用 TSMC 4N NVIDIA Custom 制程,擁有 459 億個電晶體、 Die Size 379mm² ,內建 7 個 GPC 單元、 40 個 TPC 紋理處理群集及 80 個 SM 串流多處理器,具備 10,240 個 CUDA Cores、80 個 RT Cores 及 320 個 Tensor Cores,規模相較 RTX 4080 提升約 5%。
核心時脈為面,GeForce RTX 4080 SUPER FE 預設時脈為 2,295MHz Base Clock、2,550MHz Boost Clock,時脈設定相較 RTX 4080 略微提升,最高 TDP 則與 RTX 4080 一樣維持在 320W 水平。
記憶體方面,NVIDIA GeForce RTX 4080 SUPER 同樣保持 256-bit 記憶體介面、16GB GDDR6X 記憶體容量,不過廠方將記憶體速度由 22.4Gbps 提升至 23Gbps,因此記憶體頻寬由 716.8GB/s 輕微提升至 736GB/s。
NVIDIA GeForce RTX 40 SUPER Family Full Specifications
Graphics Card | GeForce RTX 4070 Founders Edition | GeForce RTX 4070 SUPER Founders Edition | GeForce RTX 4070 Ti Founders Edition | GeForce RTX 4070 Ti SUPER Reference Design | GeForce RTX 4080 Founders Edition | GeForce RTX 4080 SUPER Reference Design |
GPU SKU | AD104-250 | AD104-350 | AD104-400 | AD103-275 | AD103-300 | AD103-400 |
GPU Architecture | NVIDIA Ada Lovelace | NVIDIA Ada Lovelace | NVIDIA Ada Lovelace | NVIDIA Ada Lovelace | NVIDIA Ada Lovelace | NVIDIA Ada Lovelace |
GPCs | 4 | 5 | 5 | 6 | 7 | 7 |
TPCs | 23 | 28 | 30 | 33 | 38 | 40 |
SMs | 46 | 56 | 60 | 66 | 76 | 80 |
CUDA Cores / SM | 128 | 128 | 128 | 128 | 128 | 128 |
CUDA Cores / GPU | 5888 | 7168 | 7680 | 8448 | 9728 | 10240 |
Tensor Cores / SM | 4 (4th Gen) | 4 (4th Gen) | 4 (4th Gen) | 4 (4th Gen) | 4 (4th Gen) | 4 (4th Gen) |
Tensor Cores / GPU | 184 (4th Gen) | 224 (4th Gen) | 240 (4th Gen) | 264 (4th Gen) | 240 (4th Gen) | 320 (4th Gen) |
RT Cores | 46 (3rd Gen) | 56 (3rd Gen) | 60 (3rd Gen) | 66 (3rd Gen) | 76 (3rd Gen) | 80 (3rd Gen) |
Frame Buffer Memory Size and Type | 12GB GDDR6X | 12GB GDDR6X | 12GB GDDR6X | 16GB GDDR6X | 16GB GDDR6X | 16GB GDDR6X |
Memory Interface | 192-bit | 192-bit | 192-bit | 256-bit | 256-bit | 256-bit |
Memory Clock (Data Rate) | 21 Gbps | 21 Gbps | 21 Gbps | 21 Gbps | 22.4 Gbps | 23 Gbps |
Memory Bandwidth | 504 GB/sec | 504 GB/sec | 504 GB/sec | 672 GB/sec | 716.8 GB/sec | 736 GB/sec |
ROPs | 64 | 80 | 80 | 96 | 112 | 112 |
L1 Data Cache/SharedMemory | 5888 KB | 7168 KB | 7680 KB | 8448 KB | 9728 KB | 10240 KB |
L2 Cache | 36864 KB | 49152 KB | 49152 KB | 49152 KB | 65535 KB | 65535 KB |
Video Engines | 1x NVENC (Gen8) 1x NVDEC (Gen5) | 1x NVENC (Gen8) 1x NVDEC (Gen5) | 2x NVENC (Gen8) 1x NVDEC (Gen5) | 2x NVENC (Gen8) 1x NVDEC (Gen5) | 2x NVENC (Gen8) 1x NVDEC (Gen5) | 2x NVENC (Gen8) 1x NVDEC (Gen5) |
TGP Power | 200W | 220W | 285W | 285W | 320W | 320W |
Transistor Count | 35.8 Billion | 35.8 Billion | 35.8 Billion | 45.9 Billion | 45.9 Billion | 45.9 Billion |
Die Size | 294.5mm² | 294.5mm² | 294.5mm² | 379.0mm² | 379.0mm² | 379.0mm² |
Manufacturing Process | TSMC 4N | TSMC 4N | TSMC 4N | TSMC 4N | TSMC 4N | TSMC 4N |
PCIe Interface | Gen4 x16 | Gen4 x16 | Gen4 x16 | Gen4 x16 | Gen4 x16 | Gen4 x16 |