Узел суперкомпьютера Summit. Фото: Национальная лаборатория Ок-Ридж (США)
Скорее всего, США вернут себе лидерство в рейтинге суперкомпьютеров TOP500. 8 июня 2018 года объявлено о запуске «самого мощного в мире» суперкомпьютера Summit мощностью 200 петафлопс. И если Китай не преподнесёт никаких сюрпризов, то в июньском TOP500 произойдёт смена лидера. Заявленных 200+ петафлопс с лихвой хватит, чтобы обогнать по результату теста Linpack нынешнего чемпиона Sunway TaihuLight (93 PFLOPS).
Суперкомпьютер Summit весит 340 тонн и занимает комнату площадью 860 м². На его охлаждение расходуется 150 тонн воды в минуту. Фото: Национальная лаборатория Ок-Ридж
Суперкомпьютер Summit состоит из 4608 узлов, на каждом из которых установлено по два 22-ядерных процессора IBM Power9 и шесть графических процессоров Nvidia Tesla V100. Узлы соединены сетью Mellanox dual-rail EDR InfiniBand с пропускной способностью 200 Гбит/с на каждый сервер. Для IBM это презентация серверов Power9-GPU AC922, которую можно предлагать другим заказчикам.
При полном оборудовании всех узлов одни только графические процессоры обеспечат пиковую производительность 215 петафлопс с двойной точностью. Кроме того, каждый V100 выдаёт ещё 125 терафлопс со смешанной точностью — это основной тип операций тензорного ядра V100. Таким образом, в приложениях глубокого обучения пиковая производительность может составить порядка 125×27648 = 3,46 эксафлопс. Если реально, то в районе 3,3 эксафлопс, считают эксперты.
Это не просто теоретические расчёты. По словам директора Национальной лаборатории Ок-Ридж Томаса Захария (Thomas Zacharia), ещё до завершения строительства системы исследователи запустили на тензорных ядрах GPU вычисления по сравнению геномов — и зафиксировали производительность 1,88 эксафлопс. Приложение обрабатывало геномы в поисках образцов, соответствующих определённым условиям. Это первый случай в истории компьютерной техники, когда был де-факто преодолён барьер в 1 эксафлопс, то есть 1018 операций с плавающей запятой в секунду. В серверной комнате этого монстра такой шум, что там невозможно работать без наушников (видео).
Узел Summit. Для суперкомпьютера в комнате проложено около 300 километров оптоволоконного кабеля. Фото: Национальная лаборатория Ок-Ридж (США)
Разумеется, кроме глубокого обучения Summit поддерживает вычисления в стандартном наборе приложений, который интересует Министерство энергетики США, в том числе вычисления, связанные с термоядерной энергией, альтернативной энергетикой, материаловедением, климатическим моделированием, вычислительной химией и космологией. В то же время Summit остаётся открытой системой, так что клиенты будут запускать на нём все виды расчётов, какие пожелают, даже совершенно не связанные с энергетикой. Предполагается, что Summit будут использовать для приложений в сфере здравоохранения в таких областях, как поиск новых лекарств. Как сказал на пресс-конференции Томас Захария, их исследовательский центр должен стать чем-то вроде CERN для медицинского дата-майнинга и аналитики.
Суперкомпьютер Summit. Фото: Национальная лаборатория Ок-Ридж
Когда в 2014 году заключался контракт с IBM на строительство этого суперкомпьютера, в его состав включили GPU. В то время у Министерство энергетики были весьма смутные представления, что делать с возможностями глубокого обучения, но компания Nvidia приняла решение внедрить в V100 тензорные ядра — и в результате Summit внезапно превратился в монстра приложений ИИ. Так что можно предположить, что систему нагрузят множеством передовых исследований ИИ, в дополнение к её основным обязанностям. Пока что проекты для Summit отбирают по заявкам, но в 2019 году система станет более широко доступной по программе Innovative and Novel Computational Impact on Theory and Experiment (INCITE).
Многоядерный микропроцессор китайского суперкомпьютера Sunway TaihuLight. До 8 июня 2018 года этот суперкомпьютер считался самым мощным в мире
После запуска Summit власти, наверное, примут решение о выводе из эксплуатации его предшественника, суперкомпьютера Titan, который в момент своего запуска в 2012 году был признан самым мощным в мире и до сих пор остаётся самым быстрым суперкомпьютером в США. Но сейчас поддерживать его работу мало смысла, потому что он в 8 раз уступает по скорости Summit, при этом потребляет в 5 раз больше энергии.
В Titan установлены графические процессоры K20X, у которых производительность в вычислениях с одинарной точностью для машинного обучения ограничена скромными четырьмя терафлопсами на устройство. Тем более все программы для Titan легко перенести на Summit.
Автор: alizar