NVIDIA GeForce RTX 系列是 NVIDIA 面向消费级市场的高性能 GPU 产品线,注重提供高性能的图形处理能力和游戏特性。主要面向游戏玩家和普通用户,同时也被广泛用于深度学习推理和训练等计算密集型任务。
主要 GPU 产品有:50 Series 、40 Series 、30 Series、20 Series、10 Series 。其主要参数如下:
NVIDIA GeForce RTX 50 Series 规格
架构:Blackwell 发布时间:2025.01 制造工艺:TSMC 3 nm
关键参数
RTX 5090D
RTX 5090D
RTX 5080
RTX 5070 Ti
RTX 5070
RTX 5060
RTX 5050
每秒 FP32 运算次数 (TFLOPS)
109.7
82
54.19
45.16
32.26
23.22
12.90
每秒运算次数 (TOPS)
3300
2375
1801
1406
988
SM 数量
170
84
70
50
36
20
CUDA Core 数量
21760
10752
8960
6400
4608
2560
Tensor Cores 数量
680
334
280
200
144
80
标准显存配置
32 GB GDDR7
16 GB GDDR7
16 GB GDDR7
12 GB GDDR7
8 GB GDDR7
8 GB GDDR6
显存位宽
512 bit
256 bit
256 bit
192 bit
128 bit
128 bit
显存带宽 (TB/sec)
1.52 TB/sec
710.1 GB/sec
710.1 GB/sec
532.6 GB/sec
355.0 GB/sec
224 GB/sec
一级缓存
128 KB
128 KB
128 KB
128 KB
128 KB
128 KB
二级缓存
88 MB
64 MB
64 MB
40 MB
32 MB
32 MB
显卡总功耗 (W)
500
350
300
220
170
100
NVIDIA GeForce RTX 40 Series 规格
架构:Ada Lovelace 发布时间:2022.09.20 制造工艺:TSMC 4 nm
关键参数
RTX 4090
RTX 4090 D
RTX 4080 SUPER
RTX 4080
RTX 4070 Ti SUPER
RTX 4070 Ti
RTX 4070 SUPER
RTX 4070
RTX 4060 Ti
RTX 4060
发售价格 (美金)
$1,599
$1,599
$1,199.00
$999.00
$799.00
$799.00
$599.00
$599.00
$399
$299.00
晶体管数量
763 亿
763 亿
459 亿
459 亿
459 亿
358 亿
358 亿
358 亿
229 亿
189 亿
晶粒面积 (mm2)
608.4
608.4
378.6
378.6
378.6
294.5
294.5
294.5
190
146
每秒 FP32 运算次数 TFLOPS
82.58
73.54
52.22
48.74
44.1
40.1
35.48
29.15
22.06
15.11
每秒运算次数 TOPS
1177
836
780
706
641
568
466
353
242
SM 数量
128
114
80
76
66
60
56
46
34
24
CUDA Core 数量
16384
14592
10240
9728
8448
7680
7168
5888
4352
3072
Tensor Cores 数量
512
456
320
304
264
240
224
184