Компания Nvidia недавно представила ускоритель H100 на новой архитектуре, но клиентам такие карты станут доступны во втором полугодии. А пока этого не произошло, компания решила показать, что её текущий ускоритель A100 намного лучше, чем более свежий Instinct MI250 компании AMD.
Для начала напомним, что Nvidia A100 оснащается 80 ГБ памяти и характеризуется производительностью 19,5 TFLOPS (FP32 и FP64).
Instinct MI250, в свою очередь, первым в мире (вместе с MI250X) получил двухкристальный GPU. Карта предлагает 128 ГБ памяти, а производительность составляет 45,3 TFLOPS (FP32 и FP64) либо 90,5 TFLOPS, если говорить о матричной производительности.
Как видим, чистая производительность решения AMD более чем вдвое выше, чем у конкурента. Это логично, так как производительность в TFLOPS высчитывается по простой формуле, где учитывается количество ядер и частота. У Nvidia A100 имеется 6912 ядер CUDA, а у MI250 в распоряжении 13 312 потоковых процессоров.
Несмотря на это, Nvidia утверждает, что её карта быстрее. Как минимум в популярных для ЦОД типах нагрузки, вроде LAMMPS, NAMD, openMM, GROMACS и AMBER.
Как видим, если верить Nvidia, её ускоритель быстрее на величину от 10% до 90%. В конфигурации из четырёх адаптеров максимальная разница уже более чем двукратна. А энергоэффективность такой связки почти втрое выше, чем у карты AMD.
Само собой, специализированные ускорители для ЦОД сравнивать между собой намного сложнее, чем игровые видеокарты, так как различия в архитектурах и оптимизации ПО порой огромны. В любом случае, даже если Nvidia A100 быстрее MI250 только в перечисленных задачах, это всё равно очень хорошо для Nvidia.