Для моделирования таких чрезвычайно сложных природных явлений, как взаимодействие субатомных частиц или влияния тумана на климат, требуется потратить много часов даже на самых быстрых суперкомпьютерах. Эмуляторы, алгоритмы, быстро аппроксимирующие результаты детальных симуляций, предлагают способ обойти это ограничение. В новой работе, опубликованной в онлайне, показано, как ИИ с лёгкостью может выдавать точные эмуляторы, способные ускорять симуляции в различных областях науки в миллиарды раз.
«Это серьёзное достижение», — говорит Дональд Лукас, занимающийся симуляцией климата в Ливерморской национальной лаборатории, не принимавший участия в данной работе. Он говорит, что новая система автоматически создаёт эмуляторы, работающие лучше и быстрее чем те, что вручную разрабатывает и обучает его команда. Новые эмуляторы можно использовать для улучшения моделей, которые они имитируют, и повышении эффективности работы учёных. Если работа пройдёт экспертную оценку, говорит Лукас, «это всё очень сильно изменит».
Типичная компьютерная ситуация может подсчитывать шаг за шагом, как физические воздействия влияют на атомы, облака, галактики – всё, что моделируют. Эмуляторы на основе такого варианта ИИ, как машинное обучение (МО), пропускают этап трудоёмкого воспроизведения природы. Получив требуемые входные и выходные данные полной симуляции, эмуляторы ищут закономерности и учатся строить догадки о том, что симуляция сделает с новым набором входных данных. Однако для создания обучающих данных требуется многократно запускать полную симуляцию – то есть, делать именно то, от чего должны избавлять эмуляторы.
Новые эмуляторы основаны на нейросетях – системах МО, вдохновлённых структурой человеческого
Основанная на этой технике технология Deep Emulator Network Search (DENSE) полагается на обобщённую схему поиска нейронной архитектуры, в разработке которой участвовала Мелоди Гуан, специалист по информатике из Стэнфордского университета. Она случайным образом вставляет вычислительные слои между входными и выходными, а потом проверяет и обучает получившуюся связь на ограниченном наборе данных. Если добавленный слой улучшает эффективность работы, то вероятность его появления в будущих вариациях сети возрастает. Повторение процесса улучшает эмулятор. Гуан говорит, что с «восторгом» следит за тем, как её работу используют «для целей получения научных открытий». Мухаммад Касим, физик из Оксфордского университета, руководивший исследованием, говорит, что его команда основывала свою работу на работе Гуан, поскольку такой подход достигает баланса между точностью и эффективностью.
Исследователи использовали DENSE для разработки эмуляторов 10 симуляций – по физике, астрономии, геологии и климатологии. Одна симуляция, к примеру, моделирует то, как сажа и другие взвешенные частицы в атмосфере отражают и поглощают солнечный свет, изменяя глобальный климат. Её работа может занять тысячи часов компьютерного времени, поэтому Данкан Уотсон-Пэррис, специалист по физике атмосферы из Оксфорда и соавтор исследования иногда использует эмулятор с МО. Однако, по его словам, эмулятор сложно настраивать, и он не может выдавать результаты с высоким разрешением вне зависимости от количества получаемых им данных.
Эмуляторы, создаваемые технологией DENSE, показывают превосходные результаты несмотря на отсутствие данных. Когда их снабдили специальными графическими чипами, они продемонстрировали ускорение от 100 000 до 2 млрд раз по сравнению с соответствующими симуляциями. Подобное ускорение нередко свойственно эмуляторам, однако их результаты также оказались и чрезвычайно точными: в одном сравнении результаты эмулятора астрономии оказались более чем на 99% идентичными результатам полноценной симуляции, а по результатам 10 симуляций эмуляторы на основе нейросетей показали лучшие результаты по сравнению с обычными. Касим говорит, что думал, что симуляторам DENSE для достижения подобной точности для каждой симуляции понадобятся десятки тысяч обучающих примеров. Но в большинстве случаев пришлось использовать лишь несколько тысяч примеров, а в случае со взвешенными атмосферными частицами – всего несколько десятков.
«Очень крутой результат, — сказал Лоуренс Перро-Левасье, астрофизик из Монреальского университета, занятый симулированием галактик, свет которых подвергается гравитационному линзированию, вызванному другими галактиками. – Впечатляет, что одну и ту же методологию можно применять для таких разных задач, и что им удалось обучить её на таком малом количестве примеров».
Лукас говорит, что эмуляторы DENSE, кроме того, что работают быстро и точно, имеют ещё одно интересное применение. Они могут решать «обратные задачи» – определять лучшие параметры модели для правильного предсказания результатов. А затем эти параметры можно использовать для улучшения полноценных симуляций.
Касим говорит, что DENSE может даже позволить учёным интерпретировать данные на лету. Его команда изучает поведение плазмы в экстремальных условиях, создаваемых гигантским рентгеновским лазером в Стэнфорде, где время эксперимента очень ценно. Анализировать их данные в реальном времени – к примеру, моделировать температуру и плотность плазмы – невозможно, поскольку на требуемые симуляции может уйти несколько дней, которых нет у исследователей, пользующихся лазером. Однако, по его словам, эмулятор DENSE мог бы интерпретировать данные достаточно быстро для того, чтобы они успели изменить эксперимент. «Надеемся, что в будущем мы сможем проводить анализ практически сразу».
Автор: Вячеслав Голованов