ИИ отправился искать жизнь в компьютерных симуляциях

2025-02-04 в 5:23, admin, рубрики: игра жизнь, искусственный интеллект, искуственная жизнь, клеточный автомат, симуляция, эволюция

Поиск искусственной жизни (artificial life или A-life) — это область науки, исследующая модели живых систем и их эволюцию в контролируемых условиях, чаще всего — в компьютерных симуляциях. поиски эти раньше часто проводились вручную, а рисерчеры из ИИ-лаборатории Sakana AI предложили новый подход к автоматизации поиска с использованием ИИ моделей, таких как CLIP.

Схема эксперимента и три направления исследования

Искусственная жизнь / Artificial life

За все время наблюдений во всей видимой нам части вселенной, жизнь появилась в единственных условиях и единственным известным нам образом –– в виде нас самих. При этом мы все еще далеки от понимания того, какие фундаментальные принципы управляют её возникновением и управляют её эволюции, как растет сложность и возникает эмерджентность простых систем во все известное нам многообразие. И еще дальше мы от воспроизведения зарождения биологической жизни в контролируемых условиях. При этом фундаментальные законы вселенной не запрещают существование и других форм жизни. а развитие интеллекта искусственного может заставить нас переопределить сами термины жизни и интеллекта, поскольку существующие крайне антропоцентричны. Возможно, это поможет нам представить, куда приведет эволюция автономных агентов, зачатки которых мы видим уже сегодня. А может быть, подготовиться ко встрече с внеземной жизнью, в случае если она когда-нибудь произойдет. Все это двигает область поиска искусственных форм жизни со следующей философией:

изучать жизнь не только такой, какой мы ее знаем, но и такой, какой она могла бы быть
изучение ранней эволюции на модельных системах, с целью лучше понять процессы зарождение жизни как таковой
ну и то, что создать голема, пускай цифрового, – это давняя мечта любого алхимика

Игра «Жизнь»

Исследователи искусственной жизни создают как роботизированные организмы, так биохимические модели, но чаще всего работают с компьютерными симуляциями. Самый известный пример симуляции, в которой разные формы artificial life были обнаружены впервые — это игра "Жизнь", которую математик Джон Конвей придумал в 1970 году. он установил правила эволюции случайно расположенных на клетчатой доске "живых" и "мертвых" пикселей. игрок задает начальное состояние и далее в игре не участвует, а позиции каждый ход обновляются автоматически согласно простым правилам:

если живая клетка имеет двух или трех живых соседей, она остаётся живой
во всех остальных живая случаях клетка умирает — от "перенаселения" если соседей больше 3 или "голода" если меньше 2
но если мертвая клетка имеет ровно трёх живых соседей, она переходит в живое состояние

Элементарно. каждый шаг игры клетки меняют состояние, а ходы эти можно повторять бесконечно долго наблюдая за развитием пиксельных паттернов. большинство начальных состояний распадаются, но могут появится и статичные фигуры: например, квадрат из 4 клеток, осциллирующие и движущиеся — например, "глайдер" из 5 клеток, который как бы летит по диагонали доски. дальше мир пополнился паровозом, светофором, малым, средним и целой эскадрильей космических кораблей. для их описания существует своя википедия

Типа устойчивых фигур в игре "Жизнь" - статичные, осциллирующие и летающие (космические корабли)

Недавно на хабре была статья от русскоязычного участника коммьюнити про совсем недавнее открытие осциллятора с периодом 41, советую прочитать. там захватывающий экскурс по великим открытиям внутри "Жизни" с датами и именами

Фигура Гершеля в случайном супе игры "Жизнь" от автора этой статьи

Вокруг игры "Жизнь" возникло живое коммьюнити из тысяч энтузиастов, а новые фигуры часто называют в честь первооткрывателей, что дополнительно мотивировало поиски. Тем не менее обнаружение новых форм жизни в этом простом на первый взгляд мире продолжается уже больше 50 лет.

А ведь “Жизнь” — только частный случай подобных симуляций, есть более сложные, и намного менее исследованные.

Исследуемые симуляции

В работе Sakana AI исследовались следующие симуляции (в статье их называют субстраты):

оригинальная игра «Жизнь» Джона Конвея
Lenia (модификация «Жизни» с непрерывным пространством‑временем)
Neural Cellular Automata, NCA («Жизнь», но взаимовлияние между соседями определяется конволюционной нейросетью)
Boids (отдельный класс симуляций, где соседние клетки сбиваются в стаи)
Particle Life (позволяет больше чем 2 вида клеток, добавляя изображению цвет)

Кто такие Sakana AI

Sakana AI это ИИ-лаба из Японии, которая исследует потенциал ИИ в научных исследованиях. не так давно они подняли много шума со своим автономным ученым, который научился генерировать правдоподобные статьи. кто-то восхищался работой и трубил, что кожаных ученых ИИ тоже скоро отправит на пенсию, кто-то возмущался, называя это прокачанной машиной плагиата, которая перегрузит и так уставших peer reviewers. Но сейчас не об этом, а об их новой статье, которая мне лично понравилась намного больше

Архитектура ИИ-исследователя Sakana AI - мульти-агентной системы на ЛЛМ для планирования, проведения и описания computer science экспериментов

Сложности поиска искусственной жизни

основная проблема области в том, что с хаотическими системами невозможно предсказать как они будут развиваться со временем, то есть специально задать условия, которые приведут к интересным результатам, не получится - нужно перебирать параметры
у некоторых симуляций тысячи возможных входных параметров, а каждую комбинацию параметров каждой из симуляций до интересных результатов нужно просчитывать на тысячи шагов времени вперед. тут не поможет не только ручной перебор, но не хватит никаких вычислительных мощностей
и третье - поиск "жизни" или "сложности" в этом цифровом первичном бульоне очень плохо формализуем. исследователи применяли метрики сложности по Колмогорову, искали самовоспроизводящиеся паттерны, но это все не приводило к желаемым результатам, поскольку сильно отличается от человеческого восприятия жизни

И здесь на помощь как раз пришел ИИ. Точнее опен-сорсная image-to-text модель CLIP (Contrastive Language–Image Pre-training) от openAI. модель была обученая на задаче генерации текстовых описаний для изображений, например "на этой фотографии 3 человека с пивом стоят у барной стойки". модель вышла во времена, когда openAI была по-настоящему открытой, так что о ней много всего написано, а все детали обучения и веса лежат на гитхабе. на самом деле авторы использовали еще одну модель - DINOv2, получив похожие результаты, так что выбор модели - вопрос не принципиальный и далее в статье используется общий термин фундаментальные модели (foundational models, FM)

как обучалась модель CLIP (Contrasive Language-Image Pre-training). источник

Возможность переводить изображения в текст позволила исследователям из Sakana AI программировать поиск искуственных форм жизни текстовыми промптами, то есть буквально “ищи изображения похожие на клетки под микроскопом” или "многоклеточный организм".

и она нашла! Такой подход авторы назвали ASAL — Automated Search for Artificial Life

Немного технических деталей

По факту и CLIP и DINOv2 используется для того чтобы конвертировать пиксельные изображения кадров симуляции в заданный момент времени в векторные эмбеддинги, и ровно то же самое делать с текстовыми промптами

Поскольку обучение таких моделей производилось на парах картинка — описание, близость векторов в пространстве эмбеддингов означает близость образов в человеческом понимании, что делает это пространство крайне информативным для численного анализа. Такой подход позволяет искать соответствия образов не в пиксельном кадре, а в его векторном представлении внутри латентного пространства CLIP.

и в таком случае основной результат статьи максимально коротко — это сведение задачи поиска искуственной жизни к задаче поиска близких векторных представлений в пространстве CLIP. а такую задачу намного легче автоматизировать

Задачи исследования были сформированы следующим образом

(1) найти все симуляции, производящие заранее заданные фигуры. например, похожие на биологические клетки под микроскопом (supervised target)

(2) найти симуляции, где сложность и новизна этих фигур продолжает со временем неограниченно расти (open-endedness)

(3) найти наиболее перспективные симуляциия для дальнейших исследований (illumination)

ИИ отправился искать жизнь в компьютерных симуляциях - 6

Основные результаты

1. Supervised target

ASAL успешно находит симуляции, соответствующие заданному текстовому запросу. например, в симуляциях Lenia, Boids и Particle Life, ASAL смог найти конфигурации, которые визуально соответствовали описаниям: "клетка", "стая птиц", "гусеница", "вирус и колония бактерий". этот подход позволил им найти сразу кучу ранее неизвестных устойчивых фигур в каждой из исследованных симуляций, даже в "Жизни".

Другой интересный результат состоит в том что они научились находить симуляции, в которых указанные образы или события появлятся в данной последовательности. так, если искать симуляции в которых сначала находится "одна клетка", а затем "две клетки", логично предположить, что где-то между ними может быть найдено нечто похожее на деление этих самых клеток — его нашли в Neural Cellular Automata.

2. Open-endedness

ASAL оказался способен находить симуляции, демонстрирующие открытость (open-endednes) симуляций, то есть способность непрерывно генерировать новые и усложняющиеся паттерны. Самое интересное, что одна из самых открытых симуляций до сих пор — оригинальная "Жизнь". Сам Конвей доказал что игра является Тьюринг-полной, то есть фигурами внутри нее можно реализовать абсолютно любой вычислительный алгоритм.

в других Life-like Cellular Automata (Lenia, NCA), ASAL обнаружил конфигураци, которые демонстрируют открытость, сравнимую "Жизнью". Эти симуляции генерируют сложные динамические паттерны, находящиеся на грани хаоса, не затухая и не взрываясь. более того, исследователи предложили модификацию симуляции ParticleLife++, которая увеличивает ее открытость

Но главный результат здесь скорее в самом подходе, когда открытость системы сводится к численным метрикам с помощью фундаментальных моделей типа CLIP. это очень сильно упрощает поиск открытых симуляций в будущем и демонстрирует потенциал ASAL для поиска симуляций, способных к непрерывному развитию и генерации новых фигур.

пример выхода одной из симуляций Lenia на плато стабильности — метрикой в латентном пространстве CLIP и визуальный в пиксельном представлении

3. Illumination

ASAL позволяет создавать "атласы симуляций", которые визуализируют все разнообразие возможных форм жизни в заданной симуляции, запущенной с разными параметрами. в экспериментах с Lenia и Boids, ASAL обнаружил множество ранее неизвестных форм жизни, напоминающих клетки и бактерии, а также различные паттерны поведения стаи клеток, такие как движение змейкой или скопление в окружности. эти атласы позволяют наглядно получить представление о всем спектре возможных форм жизни в заданной симуляции и систематизировать их по визуальному сходству.

Атлас различных форм искусственной жизни в симуляциях Lenia в латентном пространстве CLIP

здесь Важно отметить, что использование глубоких представлений FM, таких как CLIP, значительно улучшает качество картирования по сравнению с низкоуровневыми метриками, такими как сложность по Колмогорову или любые пиксельные представление

Выводы

Sakana AI предложили новую парадигму в области поиска искусственной жизни (ASAL), впервые используя фундаментальные модели ИИ, такие как CLIP для автоматического поиска интересных симуляций. Подход оказался эффективен для поиска определенных образов описанных текстом, формализации открытости симуляции (open-endedness) в широком спектре субстратов. ASAL позволяют количественно оценить многие качественные заменяя низкоуровневые метрики сложности представлениями, лучше согласованными с человеческим восприятием.

В будущем, с развитием моделей ИИ и увеличением вычислительных мощностей, эта парадигма позволит автоматически искать миры, эволюционирующие от "простых клеток" до "искусственных цивилизаций", решая одну из главных задач искуственной жизни – поиск открытых миров.

Все выводы получены для двумерных симуляций, при этом разработанные в статье методы сведения симуляций к численным метрикам помогут нам исследовать и трехмерные! Работа может быть расширена за счет использования видео- и 3D- моделей, а также больших языковых моделей. Аналогичный подход применим и в других областях, например, для поиска физических законов или генерации кода, описывающего сами субстраты.

Примечание

А я напомню, что все описанные выше симуляции определяются очень простыми правилами и ничего не знают о биологии, поэтому случайное образование кластеров из пикселей, сильно похожих на бактерии и вирусы — конечно могут оказаться невероятным совпадением или артефактом постановки эксперимента (что искали в хаотичной системе, то и нашли), но также могут обозначить границы нашего понимания зарождения биологической жизни и нового раздела науки, изучающего внутреннюю динамику этих симулированных миров, которые со временем могут все больше походить на наш.

Похожее совпадение произошло в работе Стивена Вольфрама “A New Kind Of Science”, который из комбинации клеточных автоматов и вовсе вывел все известные физические законы. неслучайно в описанной статье Sakana AI эта работа Вольфрама процитирована аж трижды.

А чтобы немного приземлить все эти абстракции на привычную нам биологию, just a kind reminer — все ваши нейромедиаторы доставляются к цели тысячи раз в секунду вот такими немного пьяными космическими кораблями.

Bee Gee - Staying alive softly playing in the backround