
NVIDIA 發佈全新 GeForce RTX 3070 Ti 顯示卡,採用完整 GA104 繪圖核心、增至 6,144 個 CUDA Cores,換上速度更快的 8GB GDDR6X 記憶體,在 256bit 記憶體介面頻寬下增至 608GB/s,官方定價 US$599 定位 2K 遊戲光追特效全開、4K 遊戲性能合格有餘,由於 NVIDIA 限制 RTX 3070 Ti 的挖礦性能,令售價有望變得較平易近人,編輯部今次找來 RTX 3070 / RTX 3080 與 RTX 3070 Ti 進行實測對比。
2K 光追特效全開、GeForce RTX 3070 Ti 新卡登場
緊接 RTX 3080 Ti,NVIDIA 9 日正式發佈全新 GeForce RTX 3070 Ti 顯示卡,這張卡原定於 2 月底上市,SKU 規格亦曾作出更改,由於對位的 AMD Radeon RX 6800 完全沒有造成威脅 ,由最初 GA102-150 繪圖核心,最後改為完壁的 GA104-400 繪圖核心,CUDA Core 數目進一步提升至 6,144 個,同時換上更高速的 8GB GDDR6X 記憶體,能滿足 2K 遊戲光追特效全開、4K 遊戲性能合格有餘 ,官方 MSRP 定價 US$599、定位 2K 效能級遊戲玩家市場。
由於 ETH 挖礦已嚴重至影響整個 PC 及 Gaming 行業生態,NVIDIA 正計劃擴大打壓 ETH 挖礦,NVIDIA GeForce RTX 3070 Ti 已在 GPU 底層中加入 ETH 偵測機制,令 RTX 3070 Ti 挖礦下降一半,Dagger Hashi-Motto 算法大約只有 35~38 MH/s,算力 RTX 3060 Ti 的 6 成實力,還輸給破功後的 RTX 3060 Ti ,而且更食電、Efficiency 低得可怕,相信礦工們對這張 RTX 3070 Ti 興趣不大。
完壁的 GA104-400 繪圖核心
▲ NVIDIA GA104-400 Block Diagram
GeForce RTX 3070 Ti 採用 GA104-400 繪圖核心,是一顆完整的 GA104 晶片,採用 8nm NVIDIA Custom 制程、SAMSUNG 代工,擁有 174 億個電晶體、Die Size 約為 392mm²,完整的 GA104 晶片內建 6 個 GPC 單元、24個 TPC 紋理處理群集及 48 個 SM 串流多處理器,增至 6,144 個 CUDA Cores、48 個 RT Cores 及 192 個 Tensor Cores。
▲ NVIDIA GA104-400-A1 繪圖核心
核心時脈方面,GeForce RTX 3070 Ti 預設時脈為 1,575MHz Base Clock、1,770 MHz Boost Clock,最高 TDP 為 290W,換上 GDDR6X 記憶體顆粒,記憶體介面雖然保持 256bit 與 RTX 3070 一樣,但記憶體速度由 14Gbps 提升至 19Gbps,令記憶體頻寬由 448GB/s 提升 608GB/s,對於處理光線追踪和特效性能有明顯改善。
GDDR6 vs GDDR6X 的差異
記憶體子系統對遊戲性能非常重要,GeForce RTX 3070 Ti 特別改用 GDDR6X 記憶體顆粒,以滿足功能更強大的著色器與更加複雜的渲染技術,它並不是單純提高晶片時脈而是透過全新的 4-Level PAM4 四級脈衝訊號,透過多級訊令技術可以在單一週期傳輸約 2 筆資料,相較舊有 GDDR6 採用的 2-Level NRZ 技術,在同時脈下頻寬提升 1 倍。
圖上顯示了 GDDR6 (左) 與 GDDR6X (右) 之間的訊號眼形比較,PAM4 並不是直接傳輸兩位 2 進制訊號,而是使用了 4個不同的電壓水平,每個電壓電平相差 250mV,每個電平代表著 2 個數據位,透過電壓差提供 00、01、10 或 11 數據。
為了解決 PAM4 技術的 SNR 訊噪問題,GDDR6X 提供了全新 MTA 編碼方案MTA,防止訊號從最高電平轉換到最低電平,反之亦然,從而提高了接口 SNR 。這是通過使每個引腳的一部分數據脈衝串在編碼引腳上傳輸的字節中的一部分(時間交織),然後使用明智選擇的代碼字將數據脈衝串的其餘部分映射到一個沒有最大躍遷的序列來實現的。最後,封裝和 PCB 設計均需要重新設計,並進行全面的信號和電源完整性分析,以實現更高的數據速度。
NVIDIA GeForce RTX 30 Family
Graphics Card | GeForce RTX 3060 | GeForce RTX 3060 Ti | GeForce RTX 3070 | GeForce RTX 3070 Ti | GeForce RTX 3080 | GeForce RTX 3080 Ti | GeForce RTX 3090 |
GPU Codename | GA106 | GA104 | GA104 | GA104 | GA102 | GA102 | GA102 |
GPU Architecture | Ampere | Ampere | Ampere | Ampere | Ampere | Ampere | Ampere |
GPCs | 3 | 5 | 6 | 6 | 6 | 7 | 7 |
TPCs | 14 | 19 | 23 | 24 | 34 | 40 | 41 |
SMs | 28 | 38 | 46 | 48 | 68 | 80 | 82 |
CUDA Cores / SM | 128 | 128 | 128 | 128 | 128 | 128 | 128 |
CUDA Cores / GPU | 3584 | 4864 | 5888 | 6144 | 8704 | 10240 | 10496 |
Tensor Cores / SM | 4 (3rd Gen) | 4 (3rd Gen) | 4 (3rd Gen) | 4 (3rd Gen) | 4 (3rd Gen) | 4 (3rd Gen) | 4 (3rd Gen) |
Tensor Cores / GPU | 112 (3rd Gen) | 152 (3rd Gen) | 184 (3rd Gen) | 192 (3rd Gen) | 272 (3rd Gen) | 320 (3rd Gen) | 328 (3rd Gen) |
RT Cores | 28 (2nd Gen) | 38 (2nd Gen) | 46 (2nd Gen) | 48 (2nd Gen) | 68 (2nd Gen) | 80 (2nd Gen) | 82 (2nd Gen) |
GPU Boost Clock (MHz) | 1777 | 1665 | 1725 | 1770 | 1710 | 1665 | 1695 |
Frame Buffer Memory Size and Type | 12228 MB GDDR6 | 8192 MB GDDR6 | 8192 MB GDDR6 | 8192 MB GDDR6X | 10240 MB GDDR6X | 12228 MB GDDR6X | 24576 MB GDDR6X |
Memory Interface | 192-bit | 256-bit | 256-bit | 256-bit | 320-bit | 384-bit | 384-bit |
Memory Clock (Data Rate) | 15 Gbps | 14 Gbps | 14 Gbps | 19 Gbps | 19 Gbps | 19 Gbps | 19.5 Gbps |
Memory Bandwidth | 360 GB/sec | 448 GB/sec | 448 GB/sec | 608 GB/sec | 760 GB/sec | 912 GB/sec | 936 GB/sec |
ROPs | 48 | 80 | 96 | 96 | 112 | 112 | |
L1 Data Cache/Shared Memory | 3584 KB | 4868 KB | 5888 KB | 6144 KB | 8704 KB | 10496 KB | 10496 KB |
L2 Cache Size | 3072 KB | 4096 KB | 4096 KB | 4096 KB | 5120 KB | 6144 KB | 6144 KB |
TGP (Total Graphics Power) | 170 Watts | 200 Watts | 220 Watts | 290 Watts | 320 Watts | 350 Watts | 350 Watts |
Transistor Count | 13.3 Billion | 17.4 Billion | 17.4 Billion | 17.4 Billion | 28.3 Billion | 28.3 Billion | 28.3 Billion |
Die Size | 276.0 mm2 | 392.5 mm2 | 392.5 mm2 | 392.5 mm2 | 628.4 mm2 | 628.4 mm2 | 628.4 mm2 |
Price | US$329 | US$399 | US$499 | US$599 | US$699 | US$1199 | US$1499 |