Компания Google представила свои новые суперкомпьютеры A3, которые созданы специально для обучения и обслуживания самых требовательных моделей искусственного интеллекта, лежащих в основе современного генеративного ИИ и инноваций в больших языковых моделях. Что интересно, эти суперкомпьютеры основаны на ускорителях Nvidia H100, хотя у Google есть свои разработки для таких задач.
Видимо, это обусловлено тем, что H100 является новейшим и очень производительным решением, для которого у Google пока нет альтернатив.
В пресс-релизе сказано, что в A3 впервые используются специально разработанные интерфейсы со скоростью 200 Гбит/с, при этом передача данных от одного GPU к другому осуществляется в обход процессора и проходит через отдельные интерфейсы от других сетей виртуальных машин и трафика данных. Это обеспечивает до 10 раз большую пропускную способность сети по сравнению с A2.
Также Google отмечает, что её интеллектуальная сетевая структура центра обработки данных Jupiter масштабируется до десятков тысяч высокосвязанных GPU и позволяет использовать реконфигурируемые оптические каналы с полной пропускной способностью, которые могут регулировать топологию по требованию.
Масштабируемость A3 позволяет Google говорить о производительности ИИ в 26 экзафлопс.
Судя по всему, под названием A3 Google подразумевает не какой-то условный суперкомпьютер, а вполне конкретную систему, состоящую из восьми GPU H100, процессора Intel Xeon Sapphire Rapids и 2 ТБ оперативной памяти DDR5-4800.
Стоит отметить, что A3 предназначены для клиентов Google, а не для самой компании.