- PVSM.RU - https://www.pvsm.ru -

Как нейросети, RL и байесовскую оптимизацию стали использовать на ускорителях заряженных частиц

Ускорители заряженных частиц — уникальные машины, играющие ключевую роль в фундаментальной науке и прикладных исследованиях. Они помогают заглянуть внутрь материи, создавать новые материалы и лекарства, а также раскрывать тайны Вселенной — от бозона Хиггса до реликтового излучения.

Ускорители заряженных частиц — сложные установки, которые требуют высокой точности работы. Даже небольшое отклонение пучка, сравнимое с долей толщины человеческого волоса, может иметь значение. Чтобы справляться с такими задачами, всё чаще используют методы машинного обучения. 

В статье мы расскажем о том, как применяют методы машинного обучения на ускорителях по всему миру. Например, нейронные сети стабилизируют орбиту пучка и оптимизируют параметры ускорителей, обучение с подкреплением используется для управления пучками заряженных частиц в сложных условиях, а байесовская оптимизация помогает решать многокритериальные задачи настройки ускорителей.

Стабилизация орбиты пучка с помощью нейронных сетей на источниках синхротронного излучения

Источники синхротронного излучения (СИ) — разновидность ускорителей, которые генерируют интенсивное электромагнитное излучение, широко применяемое в науке, промышленности и медицине. Эти установки используются для решения задач в биологии, материаловедении, фармацевтике и даже электронике. Например:

  • в вирусологии синхротронное излучение позволяет визуализировать мягкие ткани с высоким разрешением и без использования контрастных веществ  ЗНиСО [1]

  • В промышленности, такие компании, как Rolls-Royce, используют СИ для анализа прочности лопаток авиационных двигателей Rolls-Royce ESRF [2].

  • В материаловедении синхротронное излучение помогает изучать кристаллические структуры и дефекты в материалах.

Синхротронное излучение стало важным инструментом современной науки, благодаря которому было получено около 20 Нобелевских премий в различных областях, включая химию, физику и медицину. Например:

Однако работа таких установок сталкивается с серьёзными вызовами. Один из них — поддержание стабильной орбиты пучка частиц (траектории, по которой происходит движение), которая критически важна для точности экспериментов. Орбита пучка частиц в ускорителе должна поддерживаться с точностью до микрон (это в 1000 раз меньше толщины стандартного листа бумаги), но на неё влияют изменения температуры, магнитные поля, вибрации. Вот, кстати, наша статья про то, как сейсмические вибрации будут влиять на орбиту пучка в СКИФ [6]: Beam Stability [7] .

Классические подходы к стабилизации орбиты пучка в ускорителях

Для стабилизации орбиты используют датчики положения пучка (BPM) и магнитные корректоры. Основные методы:

  • MICADO (CERN, 1973): минимизирует число корректоров CERN Documentation [8].

  • Алгоритм SVD: коррекция орбиты с использованием матриц отклика APS Documentation [9].

Основные ограничения: необходимость регулярного пересчёта матриц, сложность учёта нелинейных эффектов и риск "насыщения" корректоров.

Применение нейронных сетей

На Шанхайском источнике синхротронного излучения (SSRF) для решения задачи стабильности орбиты пучка была успешно применена нейронная сеть SSRF feedback [10]. Авторы разработали и обучили нейронную сеть, которая на основе данных с 138 датчиков положения пучка (BPM) напрямую рассчитывает оптимальные параметры для 80 магнитных корректоров.  

Как обучали модель:

  1. Собрали данные за 40 минут (800 «срезов» показаний положения пучка и соответствующих значений токов  магнитных корректоров). 

  2. Подготовили данные: данные масштабировали, вычитая среднее и деля на стандартное отклонение. 

  3. Архитектура сети: Многослойный перцептрон с тремя скрытыми слоями по 100 нейронов в каждом. Функция активации — ReLU. 

  4. Обучение: Использовали стохастический градиентный спуск (SGD) и L2-регуляризацию для борьбы с переобучением. На обычном ноутбуке (!) модель натренировалась за 2 минуты и 180 эпох.

Средние абсолютные ошибки для обучающих данных и тестовых данных.

Средние абсолютные ошибки для обучающих данных и тестовых данных.

По словам авторов получились следующие преимущества:

  • Ускорение процесса коррекции орбиты и повышение точности по сравнению с классическими методами, такими как SVD.

  • Адаптация модели в реальном времени, что устраняет необходимость в регулярной калибровке.

Кстати, результаты можно было бы улучшить, добавив в модель зависимость от температуры для исключения суточных колебаний, собирая данные за полный цикл (24 часа, сезонность) вместо 40 минут.

“Провод” пучка по ускорителю с помощью RL

На ускорителе тяжёлых элементов применили обучение с подкреплением (RL) для автоматической коррекции орбиты  CAFe II RL [11]

Задача агента:

  • Автоматическое восстановление орбиты пучка заряженных частиц за ограниченное время и минимальное количество действий.

Метод:

Использовали метод Actor-Critic с алгоритмом TD3 (Twin Delayed Deep Deterministic Policy Gradient). В этом подходе один модуль (Actor) выбирает действия, а другой (Critic) их оценивает и корректирует стратегию.

  • Policy-gradient определяет, какие конкретные действия следует предпринять в текущей ситуации (например, «если пучок ушёл вверх, прижми вниз»).

  • Value-gradient оценивает текущее состояние установки и долгосрочные выгоды от действий, измеряя их полезность относительно общей цели (например, чем ближе пучок к центру, тем лучше). 

Обучение проводилось в симуляции, а затем алгоритм был протестирован на реальном ускорителе. Результаты показали:

  • В симуляции пучок, который отклонился на 9 мм, возвращался в исходное положение с отклонением менее 0,5 мм за 15 секунд;

  • На реальной установке модель корректировала орбиту менее чем за 15 секунд, даже при неисправности одного из корректоров;

  • Модель, обученная на ионах кальция, успешно корректировала орбиту для ионов марганца, протонов. 

Агент, обученный на ионах 40Ca13+ корректирует орбиту 55Mn18+.

Агент, обученный на ионах 40Ca13+ корректирует орбиту 55Mn18+.

Преимущества подхода:

  • Экономия времени: обучение проводится в симуляции, а на реальной установке требуется всего несколько секунд для коррекции.

  • Адаптивность: модель автоматически подстраивается под изменения температуры, вибрации и отказ оборудования.

  • Универсальность: одна и та же модель успешно корректирует орбиту для разных частиц (например, кальция и марганца).

Многокритериальная байесовская оптимизация для настройки ускорителей

Онлайн-настройка ускорителей требует одновременной оптимизации нескольких параметров (например, эмиттанс [12], размеры пучка, разброс энергии), что требует компромиссов между несколькими целями. Традиционные методы, такие как эволюционные алгоритмы или градиентные методы, требуют значительных вычислительных ресурсов и большого числа наблюдений.

Байесовская оптимизация (БО) предоставляет эффективное решение этой проблемы. Она строит суррогатные модели целевых функций с использованием гауссовских процессов, что позволяет:

  • Предсказывать значения целевых функций и уровень их неопределённости.

  • Снижать число необходимых измерений за счёт использования функции выбора (acquisition function).

  • Увеличивать гиперобъём Парето, что позволяет находить лучшие компромиссные решения.

Средний гиперобъем Парето-фронта み для десяти запусков многокритериальной оптимизации примера AWA с использованием алгоритмов MOBO, NSGA-II и итеративной нейронной сети (I-NN).

Средний гиперобъем Парето-фронта み для десяти запусков многокритериальной оптимизации примера AWA с использованием алгоритмов MOBO, NSGA-II и итеративной нейронной сети (I-NN).

Примером применения БО является работа с Argonne Wakefield Accelerator. В рамках экспериментов, описанных в статье Multiobjective Bayesian optimization for online accelerator tuning [13], исследователи провели настройку ускорителя с использованием многокритериальной байесовской оптимизации. Исследователи оптимизировали шесть параметров в реальном времени и результаты показали преимущества:

  • эффективную работу с ограниченным количеством наблюдений;

  • улучшение качества решений по сравнению с традиционными методами;

  • возможность интеграции физических ограничений.

Вывод

Нейронные сети и байесовская оптимизация могут сделать управление установками точнее, быстрее и экономичнее. Будущее за автоматизированными подходами, где человек сосредоточится на креативных задачах, а алгоритмы возьмут на себя рутинную оптимизацию.

Статья написана по мотивам нашего выступления на митапе в Институте ядерной физики СО РАН ML in Physics meetup [14], а после мы еще решили организовать секцию  ML in Physics [15] на DataFest 2024  - там получилось много интересного ;)

Полезные ссылки

  • Применение нейронных сетей: Статьи о применении нейронных сетей на ускорителях DELTA [16] (Германия) и BEPCII [17] (Китай).

  • Методы RL: Исследования по оптимизации инжекции пучков  Injection Optimization [18] и управлению лазерами на свободных электронах FERMI FEL [19].

  • Байесовская оптимизация: Примеры из CERN [20]  и Brookhaven National Laboratory [21].

Автор: kseniiakeera

Источник [22]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/nauchny-e-issledovaniya/405806

Ссылки в тексте:

[1] ЗНиСО: https://zniso.fcgie.ru/jour/article/view/1202

[2] Rolls-Royce ESRF: https://www.esrf.fr/Industry/news/fatigue-resistance-fan-blades

[3] Nobel Prize in Physics 2006: https://www.nobelprize.org/prizes/physics/2006/summary/

[4] Nobel Prize in Chemistry: https://www.nobelprize.org/prizes/chemistry/2009/summary/

[5] Nobel Prize in Chemistry 2020: https://www.nobelprize.org/prizes/chemistry/2020/summary/

[6] СКИФ: https://srf-skif.ru/index.php/%D0%A6%D0%9A%D0%9F_%C2%AB%D0%A1%D0%9A%D0%98%D0%A4%C2%BB_(%D0%BF%D0%BE%D0%BA%D0%BE%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5_4%2B,_%D1%8D%D0%BD%D0%B5%D1%80%D0%B3%D0%B8%D1%8F_3_%D0%93%D1%8D%D0%92)

[7] Beam Stability: https://link.springer.com/article/10.1134/S1063784224040030

[8] CERN Documentation: https://cds.cern.ch/record/790199

[9] APS Documentation: https://ieeexplore.ieee.org/document/309289

[10] SSRF feedback: https://arxiv.org/ftp/arxiv/papers/2212/2212.01010.pdf

[11] CAFe II RL: https://journals.aps.org/prab/pdf/10.1103/PhysRevAccelBeams.26.044601

[12] эмиттанс: https://bigenc.ru/c/emittans-8dd323

[13] Multiobjective Bayesian optimization for online accelerator tuning: https://journals.aps.org/prab/pdf/10.1103/PhysRevAccelBeams.24.062801

[14] ML in Physics meetup: https://www.youtube.com/watch?v=z4Y_rQUapb0&t=189s

[15] ML in Physics: https://ods.ai/tracks/df24-ml-in-physics

[16] DELTA: https://accelconf.web.cern.ch/icalepcs2019/papers/wepha138.pdf

[17] BEPCII: https://accelconf.web.cern.ch/ipac2019/papers/wepgw058.pdf

[18] Injection Optimization: https://arxiv.org/abs/2406.12735

[19] FERMI FEL: https://arxiv.org/abs/2012.09737

[20] CERN: https://arxiv.org/abs/1911.02501?utm_source=chatgpt.com

[21] Brookhaven National Laboratory: https://www.researchgate.net/publication/385311366_A_general_Bayesian_algorithm_for_the_autonomous_alignment_of_beamlines

[22] Источник: https://habr.com/ru/companies/ods/articles/868748/?utm_campaign=868748&utm_source=habrahabr&utm_medium=rss