Команда СберБанка создали новую версию фирменной нейросети — бесплатную генеративную модель для творчества Kandinsky 3.0. Усовершенствованная нейросеть представлена на конференции Сбера по искусственному интеллекту и машинному обучению AI Journey, которая проходит с 22 по 24 ноября.
Kandinsky 3.0 представлена под слоганом «Высокое искусство вашими руками». Как отмечают разработчики, новая версия лучше понимает текстовый запрос пользователя. Нейросеть теперь умеет создавать ещё более реалистичные изображения, генерировать полноценные художественные картины и арты со скетчами.
Kandinsky 3.0 лучше предыдущих версий знает элементы отечественного культурного кода. Так, значительно улучшилось качество генерации российских и советских известных личностей и персонажей, архитектурных достопримечательностей, объектов культуры и элементов народного искусства России, например гжельской росписи. Кроме того, у новой модели усовершенствована функция редактирования изображений и возможность их дорисовки в режиме бесконечного полотна (inpainting и outpainting).
Kandinsky 3.0 создаёт изображения с высоким разрешением — 1024 х 1024 пикселей, при этом может синтезировать картинки с выбранным соотношением сторон. Для обучения нейросети разработчики использовали обновлённый набор данных в размере 1,5 млрд пар «текст — изображение», содержащий данные, которые прошли многоэтапные процедуры фильтрации, что в итоге привело к заметному повышению качества генераций.
Пользователи нейросети Kandinsky 3.0 также могут создавать видеоролики по текстовому описанию в режиме анимации. По одному запросу генерируется видео длиной в четыре секунды c выбранным эффектом анимации, с частотой 24 кадра в секунду и разрешением 640×640 пикселей.
Kandinsky 3.0 понимает запросы более чем на 100 языках, а пользователи могут создавать изображения в неограниченном количестве стилей.
Оценить возможности нейросети можно на платформе fusionbrain.ai, в Telegram— и в VK-ботах, на сайте rudalle.ru. Модель работает в сервисе GigaChat, доступна в мобильных приложениях СберБанк Онлайн и Салют, а также на умных устройствах Sber по голосовой команде «Запусти художника». Сгенерировать анимационные видеоролики можно в Telegram-боте — для этого нужно оставить заявку на доступ.