
NVIDIA 推出全新「GeForce GTX 1660 Ti」主流級級繪圖卡,採用新一代「Turing」GPU 微架構、TSMC 12nm 制程,內建 1,536 CUDA Core、 96 個 Texture Unit, GPU 微架構層面改進令性能相較上代 GTX 1060 6GB 明顯提升,但省去了 RT Core 與 Tensor Core 運算單元,在功能上與 RTX 系列作出區間,官方定價約 US$279 美元。
NVIDIA GeForce GTX 1660 Ti 登場
緊接「GeForce RTX 2060」之後,NVIDIA 再發佈全新主流級「GeForce GTX 1660 Ti」繪圖卡,同樣基於全新 NVIDIA「Turing」GPU 微架構,具備全新數據執行路徑設計支援 FP 與 INT 指令並行運算,經改良的 Unified Cache 架構及更大的 L1 Cache 容量,再加上全新 Adaptive Shading 渲染技術,性能與能源效益相較上代 GTX 1060 6GB 更上一層樓。
值得注意的是,「GeForce GTX 1660 Ti」雖然採用全新「Turing」GPU 微架構,但卻省略了新一代 Tensor Cores 及 RT Cores 運算單元,不具備 RTX 光線追踪運算及 DLSS 深度學習超級採樣等新功能,因此沿用 GeForce GTX 家族並命名為 1600 系列,突顯與 GeForce RTX 2000 系列之間的差異。
據 NVIDIA 指出,現時有接近 2/3 的 GeForce 繪圖卡用家仍採用 GeForce GTX 960 或以下的型號, GeForce GTX 1660 Ti 定價 US$279 美元並提供不俗的性價表現,相較上代 GeForce GTX 1060 6GB 性能提升 1.5X,執行主流遊戲包括 PUBG、Fortnite 及 APEX Legends 等遊戲在 1080p 解析度下可提供 120fps+ 遊戲性能,相信可吸引舊卡玩家隔代升級。
NVIDIA TU116-400 繪圖核心
全新「GeForce GTX 1660 Ti」採用「TU116-400」繪圖核心,採用 TSMC 12nm FFN 制程,內建 66 億個電晶體、Die Size 約為 284mm²,擁有 3 個 GPC 圖形處理群,12 個 TPC 紋理處理群集、 24 個 SM 串流多處理器,合共1,536 個 CUDA Core 及 96 個 Texture Unit,相較上代 GeForce GTX 1060 6GB 提升不少。
每組 GPC 內擁有一組獨立的 Raster Engine 光柵處理引擎及 4 個 TPC 紋理處理群集,每個 TPC 群集包含 2 個 SM 模組,每個 SM 內建 64 個 CUDA Cores、256KB Register File 及 4 個 Texture Units,並擁有 64KB L1 Cache/Shared Memory,可因應運算或圖形工作負載作出可改變的配置。
每個 SM 單元具備兩個 FP64 運算單元,總數合共 48 個 FP64 運算單元,但圖中並沒有標示出來,它的作用是確保 FP64 代碼的程式可以正常運作,但並非主要的硬體運算單元。
內建 6 個 32bit GDDR6 記憶體控制器、總共 192bit 記憶體頻寬,每個記憶體控制器綁定 8 個 ROP 單元及 256 KB L2 Cache,合共擁有 48 個 ROP 單元及 1,536 KB L2 Cache。
GeForce GTX 1060/1070/1666 Ti vs GeForce RTX 2060
GeForce GTX 1070 | GeForce GTX 1660 Ti | GeForce GTX 1060 | GeForce RTX 2060 | |
Architecture | Pascal | Turing | Pascal | Turing |
Manufacturing Process | TSMC 16nm | TSMC 12nm | TSMC 16nm | TSMC 12nm |
Transistor Count | 7.2 Billion | 6.6 Billion | 4.4 Billion | 10.8 Billion |
Die Size | 314mm² | 284mm² | 200mm² | 445mm² |
GPCs | 3 | 3 | 2 | 3 |
TPCs | 15 | 12 | 10 | 15 |
SMs | 15 | 24 | 10 | 30 |
CUDA per SM | 128 | 64 | 128 | 64 |
Total CUDA Cores | 1920 | 1536 | 1280 | 1920 |
Tensor Cores per SM | - | - | - | 8 |
Total Tensor Cores | - | - | - | 240 |
RT Cores | - | - | - | 30 |
Base Clock | 1,506MHz | 1,500MHz | 1,506MHz | 1,365MHz |
Boost Clock | 1,683MHz | 1,770MHz | 1,708MHz | 1,680MHz |
Memory Type | GDDR5 | GDDR6 | GDDR5 | GDDR6 |
Memory Size | 8GB | 6GB | 6GB | 6GB |
Memory Interface | 256bit | 192bit | 192bit | 192bit |
Memory Clock | 8Gbps | 12Gbps | 8Gbps | 14Gbps |
Memory Bandwidth | 256 | 288.1 | 192 | 336.1 |
ROPs | 64 | 48 | 48 | 48 |
Texture Units | 120 | 96 | 80 | 120 |
L2 Cache | 2048KB | 1536KB | 1536KB | 3072KB |
TDP | 150W | 120W | 120W | 160W |