Команда Яндекса представила диффузионную нейросеть Yandex AI Rendering Technology (YandexART), которая создаёт изображения и анимацию в ответ на текстовые запросы пользователей.
Как отмечают разработчики, YandexART понимает российский культурный код — знает известные места и города страны, выдающихся личностей разных эпох и знакомых с детства персонажей мультфильмов и сказок. Например, Чебурашку, богатырей и Бабу-Ягу.
Нейросеть уже интегрирована в приложение «Шедеврум» и помогает иллюстрировать рекламные объявления в «Яндекс Бизнесе», а вскоре появится в «Яндекс Клавиатуре» и других сервисах компании.
YandexART формирует изображения и анимацию методом каскадной диффузии: сначала нейросеть генерирует картинки и кадры в соответствии с запросом пользователя, а затем поэтапно увеличивает их разрешение, насыщая деталями.
По сравнению с предыдущим поколением диффузионной модели, которая использовалась в «Шедевруме», YandexART создаёт более реалистичную и детализированную графику. По итогам внутренней оценки Яндекса её результаты лучше в 60% случаев.