
NVIDIA 正式發佈主流級 GeForce RTX 3060 12GB 顯示卡,採用全新「GA106-300」繪圖核心,具備 3,584 個 CUDA Cores、28 個 RT Cores 及 112 個 Tensor Cores,雖然記憶體介面降至 192bit 但 GDDR6 容量提升至 12GB,性能相較 GTX 1060 提升 1 倍、快 RTX 2060 約 30%,建議售價 US$329 足以應付 1080p 光追流暢打機,編輯部找來 iGAME GeForce RTX 3060 Ultra W 12G 實測。
NVIDIA GeForce RTX 3060 新卡登場
▲ NVIDIA GeForce RTX 3060 正式登場
NVIDIA 25 日正式發佈第一款主流級「Ampere」GPU 產品,核心代號為「GA106-300」的 GeForce RTX 3060,一直以來 60 型號都是 NVIDIA 最暢銷的檔次,號稱可以幹掉上代 GeForce RTX 2070,採用 NVIDIA 的第二代 RTX 架構 Ampere,配備更多的CUDA Cores、更快速的第二代 RT Cores光線追蹤核心、更快速的第三代 Tensor 核心,官方建議售價為 US$329 提供了令人難以置信的性能與功能。
據 NVIDIA 指出,GeForce RTX 3060 提供 12.7 FP32 TFLOPs 、24.9 RT TFLOPs 及 101 Tensor TFLOPs 運算能力,遊戲性能與是 GeForce GTX 1060 的 1 倍,相較上代同價位 GeForce RTX 2060 快 30%,而且 GDDR6 記憶體容量高達 12GB,竟然比 RTX 3080 的 10GB 還要多,1080p Full-HD 光追順玩遊戲不是夢。
8nm 制程、GA106-300 繪圖核心
有別於 GeForce RTX 3060 Ti 採用「GA104」繪圖核心,主流級的「GeForce RTX 3060」是採用規模較細的「GA106」繪圖核心,相較上代 「TU106」,性能差異主要來自 FP32 運算單元提升了 1 倍、升級第 2 代 RT Cores、升級第 3 代 Tensor Cores,令傳統光柵圖形運算提高了 1.7 倍,同時在光線追踪性能上提升近 2 倍。
▲ GA106 Block Diagram
「GeForce RTX 3060」採用「GA106-300」繪圖核心,採用 8nm NVIDIA Custom 制程、SAMSUNG 代工,擁有 132.5 億個電晶體、Die Size 約為 276mm²,一顆完整的 GA106 晶片內建 3 個 GPC 單元、15個 TPC 紋理處理群集及 30 個 SM 串流多處理器,合共 3,840 個 CUDA Cores、30 個 RT Cores 及 120 個 Tensor Cores。
不過,「GeForce RTX 3060」部份單元作出了屏蔽,被刪減至 14 個 TPC 紋理處理群集,只擁有 28 個 SM 串流多處理器,具備 3,584 個 CUDA Cores、28 個 RT Cores 及 112 個 Tensor Cores,相較 RTX 3060 Ti 規模縮減了 1/4。
▲ NVIDIA GA106-300-A1 繪圖核心
核心時脈方面,GeForce RTX 3060 預設時脈為 1,320MHz Base Clock、1,777 MHz Boost Clock,最高 TDP 為 170W。此外,GeForce RTX 3060 沿用 GDDR6 記憶體顆粒,記憶體介面降至 192bit,但記憶體容量卻增加至 12GB,比 GeForce RTX 3080 的 10GB 還要多,記憶體時脈為1,875MHz,傳輸速度卻高達 15Gbps,總頻寬為 360GB/s。
12GB GDDR6 記憶體優勢
對於 NVIDIA 來說,GeForce RTX 3060 12GB 除了定位遊戲玩家市場外,同時亦為專業創作者提供了高性價比的渲染運算方案,配合 NVIDIA Studio 驅動程式及擁有較多的記憶體,可以執行更大批量、更高解析度的渲染、更複雜的 AI 運算。
▲ Blender 渲染用盡 12GB 記憶體容量
此外,有不少玩家認為主流級 GPU 根本用不上那麼多記憶體,原來大部份硬件監測工具檢測 GPU 記憶體使用容量,並不能完全反映 GPU 記憶體運作狀況,檢測的容量只是應用程式的實時所需記憶體容量,但實際上不管是否真的需要,遊戲都會調用所有 GPU 記憶體容量,更多的容量可以用作緩存,減少 I/O 動作令 FPS 幀數更平穩。
為進一步說明,附上《全境封鎖2》(Tom Clancy's The Division 2)顯存分配情況。分別使用 GeForce RTX 2080 SUPER(8GB)和 RTX 2080 Ti(11GB),採用相同設置(4K Ultra預設),得到如下的測試數據,該遊戲幾乎佔滿了兩個GPU的所有幀緩衝區。
NVIDIA GeForce RTX 30 Family
Graphics Card | GeForce RTX 3060 Reference Design | GeForce RTX 3060 Ti Founders Edition | GeForce RTX 3070 Founders Edition | GeForce RTX 3080 Founders Edition | GeForce RTX 3090 Founders Edition |
GPU Codename | GA106 | GA104 | GA104 | GA102 | GA102 |
GPU Architecture | NVIDIA Ampere | NVIDIA Ampere | NVIDIA Ampere | NVIDIA Ampere | NVIDIA Ampere |
GPCs | 3 | 5 | 6 | 6 | 7 |
TPCs | 14 | 19 | 23 | 34 | 41 |
SMs | 28 | 38 | 46 | 68 | 82 |
CUDA Cores / SM | 128 | 128 | 128 | 128 | 128 |
CUDA Cores / GPU | 3584 | 4864 | 5888 | 8704 | 10496 |
Tensor Cores / SM | 4 (3rd Gen) | 4 (3rd Gen) | 4 (3rd Gen) | 4 (3rd Gen) | 4 (3rd Gen) |
Tensor Cores / GPU | 112 (3rd Gen) | 152 (3rd Gen) | 184 (3rd Gen) | 272 (3rd Gen) | 328 (3rd Gen) |
RT Cores | 28 (2nd Gen) | 38 (2nd Gen) | 46 (2nd Gen) | 68 (2nd Gen) | 82 (2nd Gen) |
GPU Boost Clock (MHz) | 1777 | 1665 | 1725 | 1710 | 1695 |
Frame Buffer Memory Size and Type | 12,228 MB GDDR6 | 8192 MB GDDR6 | 8192 MB GDDR6 | 10240 MB GDDR6X | 24576 MB GDDR6X |
Memory Interface | 192-bit | 256-bit | 256-bit | 320-bit | 384-bit |
Memory Clock (Data Rate) | 15 Gbps | 14 Gbps | 14 Gbps | 19 Gbps | 19.5 Gbps |
Memory Bandwidth | 360 GB/sec | 448 GB/sec | 448 GB/sec | 760 GB/sec | 936 GB/sec |
ROPs | 48 | 80 | 96 | 96 | 112 |
L1 Data Cache/Shared Memory | 3584 KB | 4868 KB | 5888 KB | 8704 KB | 10496 KB |
L2 Cache Size | 3072 KB | 4096 KB | 4096 KB | 5120 KB | 6144 KB |
TGP (Total Graphics Power) | 170 Watts | 200 Watts | 220 Watts | 320 Watts | 350 Watts |
Transistor Count | 13.3 Billion | 17.4 Billion | 17.4 Billion | 28.3 Billion | 28.3 Billion |
Die Size | 276.0 mm2 | 392.5 mm2 | 392.5 mm2 | 628.4 mm2 | 628.4 mm2 |
Price | US$329 | US$399 | US$499 | US$699 | US$1499 |