Компания Nvidia представила профессиональные ускорители Tesla P4 и P40. Обе новинки основаны на GPU поколения Pascal, но значительно разнятся между собой.
Некоторое время назад Nvidia условно разделила ускорители Tesla, которые в первую очередь сейчас ориентирует на системы глубокого обучения, на две категории: собственно, карты для обучения и карты для логического вывода. Новые адаптеры относятся как раз ко второй категории.
Начнём с технических характеристик. Модель Tesla P4 ориентирована на блейд-серверы и основана на GPU GP104 с 2560 ядрами CUDA. То есть это аналог настольной GeForce GTX 1080. Частоты работы значительно ниже — 810-1063 МГц для ядра и 6000 МГц для 8 ГБ памяти GDDR5. Как итог, производительность (FP32) достигает 5,5 TFLOPS. Но Nvidia посчитала, что для таких карт важна также производительность при работе с инструкциями логического вывода на основе восьмиразрядных операций (INT8), так что новые адаптеры Tesla получили специализированную поддержку высокоскоростных операций INT8. Так, для Tesla P4 заявлена производительность на уровне 22 TOPS (триллионов операций в секунду). Что интересно, TDP составляет 50 либо 75 Вт в зависимости от исполнения, а сама карта использует компактную низкопрофильную печатную плату.
Ускоритель Tesla P40 основан уже на GPU GP102 с 3840 ядрами CUDA. В данном случае ядро работает на частотах 1303-1531 МГц, а 24 ГБ памяти GDDR5 — на частоте 7200 МГц. Производительность достигает 12 TFLOPS (FP32) либо 47 TOPS (INT8). Энергопотребление лежит в пределах 250 Вт. Обе новинки оснащены пассивными СО.
Вместе с картами Nvidia представила и новое специализированное ПО. К примеру, библиотека TensorRT создана для оптимизации моделей глубокого обучения для развёртывания производства.
DeepStream SDK позволяет картам с GPU Pascal одновременно декодировать и анализировать до 93 потоков видео в разрешении HD в режиме реального времени.