
AMD 正式發佈 Radeon RX 6700 XT 效能級顯示卡,採用 RDNA 2 GPU 微架構的 Navi 22 XT 繪圖核心,具備 40 CU、2,560 SP 運算單元,96MB Infinity Cache 技術配合 12GB 大容量 GDDR6 記憶體,官方聲稱性能打贏 RTX 3070 但售價更便宜。真的嗎 ? HKEPC 編輯部找來 AMD Radeon RX 6700 XT 新卡與 GeForce RTX 3070 作對比測試。
打得贏 RTX 3070 嗎 !? AMD Radeon RX 6700 XT 正式登場
全新 RDNA 2 GPU 微架構、代號 NAVI 22 XT, AMD Radeon RX 6700 XT 正式開賣,主攻效能級玩家市場,號稱性能較 RTX 3070 更強但售價更便宜,由於 ETH 算力不高相信炒價會落在 RTX 3060 / RTX 3060 Ti 之間,傳聞首日開售是 HK$5,XXX,雖然 RDNA 2 架構的光追性能不佳,對於緊火想打機的朋友,這張卡會是 RTX 3060 Ti / RTX 3070 的最佳替代品。
定位方面, AMD 將會於 3 月 17 日推出效能級 Radeon RX 6700 XT 型號,擁有 40 個 CU、2,560 個 Stream Processors、12GB GDDR6 容量,官方定價為 US$479 美元,假想敵是 GeForce RTX 3070。
AMD Radeon RX 6700 XT 完整規格
型號 | Radeon RX 6900 XT | Radeon RX 6800 XT | Radeon RX 6800 | Radeon RX 6700 XT | Radeon RX 5700 XT |
GPU 架構 | RNDA 2 | RNDA 2 | RNDA 2 | RNDA 2 | RNDA |
晶片制程 | TSMC 7nm | TSMC 7nm | TSMC 7nm | TSMC 7nm | TSMC 7nm |
電晶體數目 | 26.8 billion | 26.8 billion | 26.8 billion | 17.2 billion | 10.3 billion |
晶片大小 | 519 mm2 | 519 mm2 | 519 mm2 | 336 mm2 | 251 mm2 |
運算單元 | 80 | 72 | 60 | 40 | 40 |
光追單元 | 80 | 72 | 60 | 40 | - |
流處理器 | 5120 | 4608 | 3840 | 2560 | 2560 |
遊戲時脈 | Up to 2015 MHz | Up to 2015 MHz | Up to 1815 MHz | Up to 2424 MHz | Up to 1755 MHz |
加速時脈 | Up to 2250 MHz | Up to 2250 MHz | Up to 2105 MHz | Up to 2581 MHz | Up to 1905 MHz |
峰值單精度計算效能 | Up to 23.04 TFLOPS | Up to 20.74 TFLOPS | Up to 16.17 TFLOPS | Up to 13.21 TFLOPS | Up to 9.75 TFLOPS |
峰值半精度計算效能 | Up to 46.08 TFLOPS | Up to 41.47 TFLOPS | Up to 32.33 TFLOPS | Up to 26.43 TFLOPS | Up to 19.5 TFLOPS |
尖峰紋理填充速率 | Up to 720.0 GT/s | Up to 648.0 GT/s | Up to 505.2 GT/s | Up to 413.0 GT/s | Up to 304.8 GT/s |
ROPs | 128 | 128 | 96 | 64 | 64 |
尖峰像素填充速率 | Up to 288.0 GP/s | Up to 288.0 GP/s | Up to 202.1 GP/s | Up to 165.2 GP/s | Up to 121.9 GP/s |
AMD Infinity Cache | 128 MB | 128 MB | 128 MB | 96 MB | - |
Memory (Up to) | 16GB GDDR6 | 16GB GDDR6 | 16GB GDDR6 | 12GB GDDR6 | 8GB GDDR6 |
記憶體頻寬 | 512 GB/s | 512 GB/s | 512 GB/s | 384 GB/s | 448 GB/s |
記憶體介面 | 256-bit | 256-bit | 256-bit | 192-bit | 256-bit |
整卡功耗 | 300W | 300W | 250W | 250W | 225W |
AMD NAVI 22 XT 繪圖核心
曾被寄望成為 N 卡殺手,全新「RDNA 2」是基於「RNDA」作出改良,目標是在相同的內部頻寬框架下,將 CU 單元的數目提升 100%,透過微架構的最佳化實現同時脈下 CU 單元功耗降低 50%,或是相同功耗讓時脈提升 1.3X,另一個方向是能大幅提升內部緩存命中率,讓 CU 單元減低單元閒置,令 GPU 指令吞吐量能進一步提升,在 GDDR6 頻寬保持不變提升記憶體有效頻寬等,最終達至 +54% 的性能功耗比提升,不過弱點就是 Ray-Tracing 性能,啟動 RT 後性能會甚至被 RTX 3060 吊打。
與 Radeon RX 6800 / 6900 系列不同,Radeon RX 6700 XT 是採用 Navi 22 XT 繪圖核心,運算規模大約是 Navi 21 的一半,記憶體子系統則是 Navi 22 的 3/4,同樣是 TSMC 7nm,Die Size 由 519mm² 縮減至 336 mm²,電晶體數目亦由 2.38 億降至 1.72 億個。 全新「RDNA 2」設計針對 Compute Unit 重新設計,「Navi 22」繪圖核心擁有 2 個 Shader 引擎共享前端,每個 Shader 引擎擁有 2 組 Graphics Array 運算群,每個 GA 運算群內含 5 個 Dual Compute Unit (DCU) 並共享 L1 Cache、Rasterizer、RB+、Prim Unit 等資源。
此外,前端換上了重新設計的 RB+ 光柵化單元,每個 Shader 引擎共享 32 個 RB+ 單元,數目與上代 RDNA 相同,但每個週期能處理 8 個 32bit Pixel 指令,數目是上代的 1 倍,更重要是新增 Variable Rate Shading (VRS) 可變速率著色、 Mesh Shaders 網格著色器、Sampler Feedback 取樣器回饋等功能,以滿足 DirectX 12 Ultimate 規格要求 ,允許遊戲選擇性地降低畫面裡部分區域的細節水平來提高效能,對圖像品質幾乎沒有明顯影響但性能卻能進一步提升。
RDNA 2 微架構與 RDNA 同樣採用 Dual Compute Unit (DCU) 設計,將 2 個 CU 結合在一起並共用 Scalar Data Cache、Shader Instruction Cache 及 Local Data Share,DCU 設計可以讓 Shader Processor 之間有更佳的並行運算能力,今代積累 Zen CPU 研發時所得出的高時脈設計經驗,RDNA 2 加入了 Streamlined Micro-Architecture 設計,DCU 的 Pipeline Logic 佈局修改後,令運作時脈可以在相同功耗下提升 1.3X。
RDNA 2 微架構在每個 CU 中加入了 Ray Accelerator (RA) 硬體加速運算單元,屬於軟硬體混合加速方式,實現支援光線追踪影像特效,它是基於 Microsoft Raytracing (DXR) API,每個 Ray Accelerator 每個時鐘可完成 4 Ray/Box 或 1 Ray/Triangle 的光線相交運算,運算速度較純軟件運算性能提升約 10x,雖然與 NVIDIA 的 RT 硬體運算單元設計仍有距離,但至少 Ray Tracing 不再是 NVIDIA 卡的專利。
96MB Inifinity Cache 超大緩存
有別於 NVIDIA 採用更寬的記憶體介面、更高速的 GDDR6X 記憶體顆粒,AMD 的做法明顯比 NVIDIA 聰明,在 RDNA 2 微架構中加入 Infinity Cache 技術在 L2 Cache 與 GDDR6 之間加入Infinity Cache,RX 6700 XT 的 Infinity Cache 容量略減至 96MB,GPU 與 Infinity Cache 之間由 12 條 64bit 1.94GHz 的 Infinity Fabric 連結,頻寬基本上是 256bit GDDR6 記憶體的 3 倍。
據 AMD 指出,Infinity Cache 將能大幅升遊戲 Workload 資料命中率,降低讀取延遲達 34%,並減少 GDDR6 記憶體頻寬使用,令 192 bit GDDR6 + Infinity Cache 的實際性能表現近乎 256bit GDDR6 的 2.5X,但卻用只需 256bit GDDR6 的 0.9x 功耗, Infinity Cache 可以說是 RDNA 2 微架構最重要性能改動。
支援 Smart Access Memory 技術
除了 Infinity Cache 技術外,RDNA 2 微架構另一項重要的記憶體改良就是 Smart Access Memory 技術,傳統的 x86 PC 架構中受限於 PCIe 規範,只能透過 Base Address Register (BAR) 每次將 256MB 系統記憶體映射到 GPU 記憶體,這個限制嚴重影響到系統記憶體與 GPU 記憶體之間的資料傳輸效率。
AMD 在 RDNA 2 中加入了全新 Smart Access Memory 技術,當用家使用AMD 新一代 Ryzen 3000 / 5000 系列處理器時,不再使用 PCIe Mapping 方式,CPU 可以直接存取 GPU 記憶體,完全解除 CPU 與 GPU 之間的讀寫瓶頸,遊戲性能平均能提升約 6%,尤其對大量使用 Texture 貼圖的遊戲,效能提升會更為明顯。