Компания Nvidia продолжает делиться подробностями о видеокартах GeForce RTX 50 после анонса и перед стартом продаж. К примеру, мы уже видели тесты RTX 5090 в Cyberpunk 2077, а теперь пришёл черёд новых данных об архитектуре Blackwell и GPU.
Новые графические процессоры производятся по нормам 4 нм, а топовый GPU содержит 92 млрд транзисторов, что чудовищно много для игровой видеокарты.
Производительность в задачах ИИ достигает 4000 TOPS, но это благодаря поддержке вычислений FP4. Производительность блоков трассировки лучей равна 380 TFLOPS, а вот в режиме FP32 производительность составляет 125 TFLOPS.
Другие заметные улучшения включают поддержку DisplayPort 2.1 (UHBR20), поддержку PCIe 5.0 и 4K NVDEC/NVENC с цветами 4:2:2.
Сравнивая вычислительные блоки SM архитектуры Ada Lovelace с Blackewell, нужно вспомнить, что её в прошлом поколении было разделение FP32 на два блока, один из которых мог выполнять только вычисления FP32, а другой мог выполнять как FP32, так и INT32. В архитектуре Blackwell компания удвоила пропускную способность своего блока INT32, что может помочь ускорить различные рабочие нагрузки и выполнение шейдеров, а тензорные ядра пятого поколения также предлагают вышеупомянутую удвоенную пропускную способность.
Переходя к усовершенствованиям трассировки лучей, ядра RT четвёртого поколения представляют различные новые возможности, такие как механизм пересечения кластеров треугольников, который заменяет предыдущий механизм пересечения треугольников, оптимизированный для мегагеометрии и способный гораздо эффективнее обрабатывать кластеры мегагеометрии и стандартной геометрии.
Движок Mega Geometry также имеет новый формат сжатия Triangle Cluster, который может быть распакован с помощью встроенного в чип движка Blackwell. Наконец, есть новый блок Linerar Swept Spheres, который ускоряет рендеринг RTX Hair and Fur. В итоге новые ядра RT обеспечивают в восемь раз большую скорость пересечения треугольников лучей, одновременно уменьшая объем памяти на 25%.