Как и ожидалось, в рамках конференции SC19 компания Intel представила свой первый графический процессор на архитектуре Intel Xe HPC, который получил кодовое название Ponte Vecchio, в часть средневекового моста Понте-Веккьо в итальянской Флоренции. Компания Intel называет новинку своим первым GPU для суперкомпьютеров экзофлопсного уровня. Об особенностях архитектуры новинки мы расскажем в отдельном материале.
По словам Intel, Ponte Vecchio — это высокопроизводительный дискретный графический процессор общего назначения, который в первую очередь предназначен для различных высокопроизводительных вычислений (HPC) и машинного обучения. Отмечается, что архитектура Intel Xe в новом GPU была оптимизирована именно под эти задачи.
Архитектура Intel Xe будет доступна в различных версиях
Также Intel отмечает, что графический процессор Ponte Vecchio будет производиться на 7-нм техпроцессу. Он будет состоять из нескольких кристаллов и использовать многослойную 3D-упаковку Intel Foveros. Для связи между кристаллами в рамках одной упаковки будут использоваться полупроводниковые мосты EMIB (Embedded Multi-Die Interconnect Bridge). Отмечается также использование скоростной памяти HBM (версия не уточняется) и скоростного интерконнекта CXL (Compute Express Link). На основе последнего будет создан интерфейс Xe Link для связи между GPU.
Вдаваться в подробности обо всех особенностях архитектуры новых графических процессоров компания Intel не стала. Впрочем, было отмечено, что решение будет использовать сразу несколько микроархитектур, оптимизированных под разные задачи. Это позволит создавать продукты для различных сегментов рынка и даст возможность лёгкого масштабирования. На основе Xe будут сделаны и ультрамобильные карты, и ускорители для серверов.
В частности, новые GPU для ЦОД будут обладать гибким механизмом параллельной обработки данных, высокой производительностью при работе с числами двойной точности (FP64) и ультравысокой пропускной способностью кеша и памяти. Они будут использованы в составе будущего суперкомпьютера Aurora, первой в США машины экзафлопсного класса. Каждый узел будет иметь два процессора Xeon Sapphire Rapids и шесть GPU Xe, соединённых шиной CXL, а также модули Optane DCPMM. Aurora получит суммарно 10 Пбайт памяти и хранилище ёмкостью более 230 Пбайт.