Interested Article - GeForce 40
- 2021-09-06
- 2
GeForce 40 — семейство графических процессоров компании Nvidia . Серия была анонсирована 20 сентября 2022 года . Видеокарты этой серии основаны на микроархитектуре Ada Lovelace , названной в честь математика Ады Лавлейс .
История
20 сентября 2022 года на презентации исполнительный директор компании NVIDIA — Дженсен Хуанг , анонсировал архитектуру и первые продукты на ее основе — GeForce RTX 4090 и две GeForce RTX 4080 по цене MSRP 1599, 1199 и 899 долларов США соответственно. Также была представлена новая версия технологии умного сглаживания DLSS 3.0 и RTX Remix, предназначенная для модернизации графики .
14 октября 2022 года компания NVIDIA «деанонсировала» видеокарту GeForce RTX 4080 12GB в связи с путаницей в названии. Также опубликовала дату выхода GeForce RTX 4080 16GB — 16 ноября 2022 года.
10 ноября 2022 года NVIDIA анонсировала видеокарту GeForce RTX 4070 Ti, которой стала переименованная GeForce RTX 4080 12GB. Дата показа — 3 января 2023 года, выход в свет назначен на 5 января 2023 года.
3 января, как и было обещано, NVIDIA продемонстрировала GeForce RTX 4070 Ti, а через пару дней она вышла в продажу.
12 апреля 2023 года была представлена GeForce RTX 4070, начало продаж которой состоялось на следующий день.
18 мая 2023 года NVIDIA представила RTX 4060 и RTX 4060 Ti, и также объявила что RTX 4060 Ti на 8ГБ выйдет 24 мая, а 4060 и 4060 Ti на 16ГБ выйдут в июле.
14 июня 2023 года NVIDIA объявила что RTX 4060 выйдет немного раньше, а именно — 29 июня.
28 декабря 2023 года произошел тихий анонс ускорителя NVIDIA GeForce RTX 4090 D (сокращение от Dragon) для китайского рынка, в обход санкций США. Она немного уступает по техническим характеристикам базовой модели.
Архитектура
Архитектурные улучшения Ada Lovelace включают :
- Ядра CUDA 9.x
- Техпроцесс TSMC 4N
- Тензорные ядра четвёртого поколения с поддержкой FP8, FP16, bfloat16, TensorFloat-32 (TF32)
- Ядра трассировки лучей третьего поколения
- NVENC с аппаратной поддержкой AV1
Технические характеристики
Настольные
- Видеокарты 4060 и 4060 Ti имеют память GDDR6 , остальные же видеокарты имеют память GDDR6X.
Модель | RTX 4060 | RTX 4060 Ti | RTX 4070 | RTX 4070 Super | RTX 4070 Ti | RTX 4070 Ti Super | RTX 4080 | RTX 4080 Super | RTX 4090 D | RTX 4090 | |
---|---|---|---|---|---|---|---|---|---|---|---|
Дата выхода | 29.06.2023 | 24.05.2023 | 18.07.2023 | 13.04.2023 | 17.01.2024 | 05.01.2023 | 24.01.2024 | 16.11.2022 | ? | 28.12.2023 | 12.10.2022 |
GPU | AD107 | AD106 | AD104 | AD103 | AD102 | ||||||
Технологический процесс изготовления | TSMC 4N (5-нанометров) | ||||||||||
Площадь кристалла, мм² | 159 | 188 | 294 | 379 | 609 | ||||||
Количество транзисторов, млрд | 18.9 | 22.9 | 35.8 | 45.9 | 76.3 | ||||||
Количество скалярных процессоров (ядер CUDA) | 3072 | 4352 | 5888 | 7168 | 7680 | 8448 | 9728 | 10240 | 14592 | 16384 | |
Количество тензорных ядер | 96 | 136 | 184 | 224 | 240 | 264 | 304 | 320 | 456 | 512 | |
Количество RT ядер | 24 | 34 | 46 | 56 | 60 | 66 | 76 | 80 | 114 | 128 | |
Количество кластеров обработки графики (GPC) | 2 | 3 | 4 | 5 | 6 | 7 | 10 | 11 | |||
Количество блоков мультипроцессоров (SM) | 24 | 34 | 46 | 56 | 60 | 66 | 76 | 80 | 114 | 128 | |
Количество текстурных блоков (TMU) | 96 | 136 | 184 | 224 | 240 | 264 | 304 | 320 | 456 | 512 | |
Количество блоков растеризации (ROP) | 32 | 48 | 64 | ? | 80 | ? | 112 | ? | 176 | ||
Заполнение сцены, млрд пикс / с | 58.5 | 110.8 | 122.9 | ? | 184.8 | ? | 247.5 | 257.0 | ? | 392.5 | |
Заполнение сцены, млрд текс / с | 175.6 | 314.1 | 353.3 | ? | 554.4 | ? | 671.8 | 734.4 | ? | 1141.8 | |
Объём кэша L2, МБ | 24 | 32 | 36 | 48 | 64 | 72 | |||||
Разрядность шины видеопамяти, бит | 128 | 192 | 256 | 384 | |||||||
Стандарт видеопамяти | GDDR6 | GDDR6X | |||||||||
Объём видеопамяти, ГБ | 8 | 16 | 12 | 16 | 24 | ||||||
Пропускная способность шины памяти, ГБ / с | 272 | 288 | 504 | 672 | 716 | 736 | 1008 | ||||
Интерфейс | PCI Express 4.0 x8 | PCI Express 4.0 x16 | |||||||||
Энергопотребление, Вт | 115 | 160 | 165 | 200 | 220 | 285 | 320 | 425 | 450 | ||
Частота ядра, МГц | 1830 | 2310 | 1920 | 1980 | 2310 | 2340 | 2205 | 2295 | 2280 | 2235 | |
Частота в режиме Turbo Boost, МГц | 2460 | 2535 | 2475 | 2610 | 2505 | 2550 | 2520 | ||||
Реальная (номинальная) частота видеопамяти, МГц | 2125 (17000) | 2250 (18000) | 1313 (21000) | 1400 (22400) | 1437 (23000) | 1313 (21000) | |||||
Производительность FP32, TFLOPS | 11.24 | 20.10 | 22.61 | 28.38 | 35.48 | 39.53 | 42.99 | 47.00 | 66.53 | 73.07 | |
Производительность FP64, TFLOPS | 0.175 | 0.314 | 0.353 | 0.443 | 0.554 | 0.617 | 0.672 | 0.734 | 1.039 | 1.142 | |
Производительность FP16, TFLOPS | 11.24 | 20.10 | 22.61 | 28.38 | 35.48 | 39.53 | 42.99 | 47.00 | 66.53 | 73.07 | |
Производительность тензорных ядер INT8/INT4 , TOPS | ? | ? | ? | ? | 320.8/641.6 | ? | 389.8/779.6 | 417.8/835.6 | ? | 660.6/1321.2 | |
Производительность RT ядер, Giga Rays/s | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | |
Операций трассировки лучей , Tera RTX - OPS / s | 29.2 | 52.3 | 58.8 | 73.9 | 92.4 | 102.9 | 111.7 | 122.4 | 173.2 | 190.7 | |
Поддержка версий API | Direct3D 12_2 , OpenGL 4.6 , Vulkan 1.3 , OpenCL 3.0 | ||||||||||
Поддержка версии Shader Model | Shader Model 6.5 |
Мобильные для ноутбуков
- Все модели оснащены памятью GDDR6.
Модель | RTX 4050 | RTX 4060 | RTX 4070 | RTX 4080 | RTX 4090 |
---|---|---|---|---|---|
Дата выхода | 22.02.2023 | 08.02.2023 | |||
GPU | AD107 | AD106 | AD104 | AD103 | |
Технологический процесс изготовления | TSMC 4N | ||||
Площадь кристалла, мм² | 156 | 186 | 294 | 378 | |
Количество транзисторов, млрд | 18.9 | 22.9 | 35.8 | 49.5 | |
Количество скалярных процессоров (ядер CUDA) | 2560 | 3072 | 4608 | 7424 | 9728 |
Количество тензорных ядер | 80 | 144 | 232 | 304 | |
Количество RT ядер | 20 | 36 | 58 | 76 | |
Количество текстурных блоков (TMU) | 80 | 96 | 144 | 232 | 304 |
Количество блоков растеризации (ROP) | 32 | 48 | 80 | 112 | |
Количество блоков мультипроцессоров (SM) | 20 | 24 | 36 | 58 | 76 |
Объём кэша L2, МБ | 12 | 32 | 48 | 64 | |
Разрядность шины видеопамяти, бит | 96 | 128 | 192 | 256 | |
Стандарт видеопамяти | GDDR6 | ||||
Объём видеопамяти, ГБ | 6 | 8 | 12 | 16 | |
Пропускная способность шины памяти, ГБ / с | 192 | 256 | 432 | 576 | |
Энергопотребление, Вт | 35-115 | 60-150 | 80-150 | ||
Частота ядра, МГц | 1650 | 1470 | 1230 | 1350 | 1455 |
Частота в режиме Turbo Boost, МГц | 2370 | 2175 | 2280 | 2040 | |
Реальная (номинальная) частота видеопамяти, МГц | ? | ||||
Производительность FP32, TFLOPS | 8.98 | 11.61 | 15.62 | 24.72 | 32.98 |
Производительность FP64, TFLOPS | 0.140 | 0.181 | 0.244 | 0.386 | 0.515 |
Производительность FP16, TFLOPS | 8.98 | 11.61 | 15.62 | 24.72 | 32.98 |
Поддержка версий API | Direct3D 12_2 , OpenGL 4.6 , Vulkan 1.3 , OpenCL 3.0 | ||||
Поддержка версии Shader Model | Shader Model 6.5 |
Неисправности разъема 12VHPWR
Некоторые покупатели RTX 4090 сообщили, что разъемы 12VHPWR, также известные как PCIe Gen 5 или 16-контактные разъемы их RTX 4090 плавились, что породило несколько теорий, объясняющих это. После расследования несколько источников сообщили, что основной причиной было то, что разъем 12VHPWR не был полностью вставлен в разъем под нагрузкой, что привело к перегреву контактов разъема, что, в свою очередь, привело к плавлению пластикового корпуса.
PCI-SIG, организация по стандартизации, ответственная за создание разъема 12VHPWR, решила внести изменения в спецификации разъема после недавних сбоев.
Против Nvidia был подан коллективный иск по поводу плавления кабелей 12VHPWR, которые, как говорится в иске, являются «опасным продуктом, который не следует продавать в его нынешнем состоянии». Истец подавший иск утверждает, что Nvidia несправедливо обогатилась, нарушила гарантию на продукт и занимались мошенничеством, а также требуют от Nvidia выплатить пострадавшим клиентам возмещение ущерба в качестве компенсации.
После собственного расследования и испытаний Nvidia официально выступила с заявлением о плавящихся разъемах. Они определили, что плавящиеся разъемы являются причиной ошибки пользователя из-за неправильной установки разъема 12VHPWR, что привело к частичному контакту. Они предложили ускоренную процедуру RMA для любого RTX 4090, на котором имеются плавящиеся разъемы. Позднее PCI-SIG заявила в своем заявлении, что Nvidia и ее партнеры по-прежнему несут ответственность за тестирование своих продуктов с целью учета ошибок пользователей.
Примечания
- ↑ (рус.) . 3DNews . (20 сентября 2022). Дата обращения: 21 сентября 2023. 14 октября 2022 года.
- . 3dnews. Дата обращения: 14 октября 2022. 14 октября 2022 года.
- . 3dnews. Дата обращения: 25 мая 2023. 25 мая 2023 года.
- . 3dnews. Дата обращения: 25 мая 2023. 25 мая 2023 года.
- . gagadget. Дата обращения: 15 июня 2023. 16 июня 2023 года.
- . 3DNews. Дата обращения: 28 декабря 2023. 28 декабря 2023 года.
- (англ.) . NVidia. Дата обращения: 20 сентября 2022. 20 сентября 2022 года.
- (англ.) . docs.nvidia.com . Дата обращения: 20 сентября 2022. 3 мая 2021 года.
- (рус.) . NVIDIA . Дата обращения: 27 июня 2023. 22 июня 2023 года.
- (рус.) . NVIDIA . Дата обращения: 27 июня 2023. 22 июня 2023 года.
- (рус.) . NVIDIA . Дата обращения: 15 апреля 2023. 15 апреля 2023 года.
- . NVIDIA . Дата обращения: 7 января 2023. 7 января 2023 года.
- . www.nvidia.com . Дата обращения: 20 сентября 2022. 20 сентября 2022 года.
- . www.nvidia.com . Дата обращения: 20 сентября 2022. 20 сентября 2022 года.
- Целочисленные операции над значениями с 8 и 4 битами соответственно. (То есть 0..255 и 0..15) — от 24 апреля 2020 на Wayback Machine
Ссылки
- на официальном сайте NVidia (рус.)
- на rualligator.ru
- 2021-09-06
- 2