2021-03-31
12GB GDDR6 !! 快 1060 一倍
NVIDIA GeForce RTX 3060 12GB 顯示卡評測
文: John Lam / 評測中心


NVIDIA 正式發佈主流級 GeForce RTX 3060 12GB 顯示卡,採用全新「GA106-300」繪圖核心,具備 3,584 個 CUDA Cores、28 個 RT Cores 及 112 個 Tensor Cores,雖然記憶體介面降至 192bit 但 GDDR6 容量提升至 12GB,性能相較 GTX 1060 提升 1 倍、快 RTX 2060 約 30%,建議售價 US$329 足以應付 1080p 光追流暢打機,編輯部找來 iGAME GeForce RTX 3060 Ultra W 12G 實測。



NVIDIA GeForce RTX 3060 新卡登場

 

RTX 3060

▲ NVIDIA GeForce RTX 3060 正式登場

 

 

NVIDIA 25 日正式發佈第一款主流級「Ampere」GPU 產品,核心代號為「GA106-300」的 GeForce RTX 3060,一直以來 60 型號都是 NVIDIA 最暢銷的檔次,號稱可以幹掉上代 GeForce RTX 2070,採用 NVIDIA 的第二代 RTX 架構 Ampere,配備更多的CUDA Cores、更快速的第二代 RT Cores光線追蹤核心、更快速的第三代 Tensor 核心,官方建議售價為 US$329 提供了令人難以置信的性能與功能。

 

 

 

RTX 3060

 

 

據 NVIDIA 指出,GeForce RTX 3060 提供 12.7 FP32 TFLOPs 、24.9 RT TFLOPs 及 101 Tensor TFLOPs 運算能力,遊戲性能與是 GeForce GTX 1060 的 1 倍,相較上代同價位 GeForce RTX 2060  快 30%,而且 GDDR6 記憶體容量高達 12GB,竟然比 RTX 3080 的 10GB 還要多,1080p Full-HD 光追順玩遊戲不是夢。

 

 

 

8nm 制程、GA106-300 繪圖核心

 

有別於 GeForce RTX 3060 Ti 採用「GA104」繪圖核心,主流級的「GeForce RTX 3060」是採用規模較細的「GA106」繪圖核心,相較上代 「TU106」,性能差異主要來自 FP32 運算單元提升了 1 倍、升級第 2 代 RT Cores、升級第 3 代 Tensor Cores,令傳統光柵圖形運算提高了 1.7 倍,同時在光線追踪性能上提升近 2 倍。

 

 

RTX 3060

▲ GA106 Block Diagram

 

 

「GeForce RTX 3060」採用「GA106-300」繪圖核心,採用 8nm NVIDIA Custom 制程、SAMSUNG 代工,擁有 132.5 億個電晶體、Die Size 約為 276mm²,一顆完整的 GA106 晶片內建 3 個 GPC 單元、15個 TPC 紋理處理群集及 30 個 SM 串流多處理器,合共 3,840 個 CUDA Cores、30 個 RT Cores 及 120 個 Tensor Cores。

 

不過,「GeForce RTX 3060」部份單元作出了屏蔽,被刪減至 14 個 TPC 紋理處理群集,只擁有 28 個 SM 串流多處理器,具備 3,584 個 CUDA Cores、28 個 RT Cores 及 112 個 Tensor Cores,相較 RTX 3060 Ti 規模縮減了 1/4。

 

 

RTX 3060

▲ NVIDIA GA106-300-A1 繪圖核心

 

 

核心時脈方面,GeForce RTX 3060 預設時脈為 1,320MHz Base Clock、1,777 MHz Boost Clock,最高 TDP 為 170W。此外,GeForce RTX 3060 沿用 GDDR6 記憶體顆粒,記憶體介面降至 192bit,但記憶體容量卻增加至 12GB,比 GeForce RTX 3080 的 10GB 還要多,記憶體時脈為1,875MHz,傳輸速度卻高達 15Gbps,總頻寬為 360GB/s。

 

 

 

 12GB GDDR6 記憶體優勢

 

對於 NVIDIA 來說,GeForce RTX 3060 12GB 除了定位遊戲玩家市場外,同時亦為專業創作者提供了高性價比的渲染運算方案,配合 NVIDIA Studio 驅動程式及擁有較多的記憶體,可以執行更大批量、更高解析度的渲染、更複雜的 AI 運算。

 

 

RTX 3060

▲ Blender 渲染用盡 12GB 記憶體容量

 

 

此外,有不少玩家認為主流級 GPU 根本用不上那麼多記憶體,原來大部份硬件監測工具檢測 GPU 記憶體使用容量,並不能完全反映 GPU 記憶體運作狀況,檢測的容量只是應用程式的實時所需記憶體容量,但實際上不管是否真的需要,遊戲都會調用所有 GPU 記憶體容量,更多的容量可以用作緩存,減少 I/O 動作令 FPS 幀數更平穩。

 

RTX 3060

 

為進一步說明,附上《全境封鎖2》(Tom Clancy's The Division 2)顯存分配情況。分別使用 GeForce RTX 2080 SUPER(8GB)和 RTX 2080 Ti(11GB),採用相同設置(4K Ultra預設),得到如下的測試數據,該遊戲幾乎佔滿了兩個GPU的所有幀緩衝區。

 

 

 

NVIDIA GeForce RTX 30 Family

Graphics CardGeForce RTX 3060
Reference Design
GeForce RTX 3060 Ti
Founders Edition
GeForce RTX 3070
Founders Edition
GeForce RTX 3080
Founders Edition
GeForce RTX 3090
Founders Edition
GPU CodenameGA106GA104GA104GA102GA102
GPU ArchitectureNVIDIA AmpereNVIDIA AmpereNVIDIA AmpereNVIDIA AmpereNVIDIA Ampere
GPCs35667
TPCs1419233441
SMs2838466882
CUDA Cores / SM128128128128128
CUDA Cores / GPU358448645888870410496
Tensor Cores / SM4 (3rd Gen)4 (3rd Gen)4 (3rd Gen)4 (3rd Gen)4 (3rd Gen)
Tensor Cores / GPU112 (3rd Gen)152 (3rd Gen)184 (3rd Gen)272 (3rd Gen)328 (3rd Gen)
RT Cores28 (2nd Gen)38 (2nd Gen)46 (2nd Gen)68 (2nd Gen)82 (2nd Gen)
GPU Boost Clock (MHz)17771665172517101695
Frame Buffer Memory Size and Type12,228 MB GDDR68192 MB GDDR68192 MB GDDR610240 MB GDDR6X24576 MB GDDR6X
Memory Interface192-bit256-bit256-bit320-bit384-bit
Memory Clock (Data Rate)15 Gbps14 Gbps14 Gbps19 Gbps19.5 Gbps
Memory Bandwidth360 GB/sec448 GB/sec448 GB/sec760 GB/sec936 GB/sec
ROPs48809696112
L1 Data Cache/Shared Memory3584 KB4868 KB5888 KB8704 KB10496 KB
L2 Cache Size3072 KB4096 KB4096 KB5120 KB6144 KB
TGP (Total Graphics Power)170 Watts200 Watts220 Watts320 Watts350 Watts
Transistor Count13.3 Billion17.4 Billion17.4 Billion28.3 Billion28.3 Billion
Die Size276.0 mm2392.5 mm2392.5 mm2628.4 mm2628.4 mm2
PriceUS$329US$399US$499US$699US$1499

 

 

發表評論