Команда СберБанка поделилась свежими новостями о развитии проекта фирменной нейросети — бесплатной генеративной модели Kandinsky. В новой версии Kandinsky 2.2 появилось сразу несколько новых возможностей для создания настоящих шедевров.
С Kandinsky 2.2 можно создавать фотореалистичные изображения с более высоким разрешением и изменять соотношение сторон при генерации. Как отметили разработчики, значительного прироста качества удалось достигнуть при создании портретов. Для дообучения нейросети использовался пакет данных в размере 1,5 млрд пар «текст — изображение». Это на 300 млн больше, чем в предыдущей версии — Kandinsky 2.1.
Новая версия Kandinsky научилась генерировать стикеры, из которых можно собирать полноценные стикерпаки в Telegram. Также бот Kandinsky 2.2 теперь способен изменять по текстовому описанию отдельные объекты или элементы на изображениях, сохраняя композицию исходной иллюстрации. Это стало возможным благодаря внедрению в модель специального структурного блока управляемых изменений — ControlNet.
Kandinsky 2.2 понимает запросы на русском и английском языках, умеет рисовать более чем в 20 стилях, смешивать несколько рисунков, стилизовать изображение по текстовому описанию, генерировать изображения, похожие на заданные, дорисовывать недостающие части картинки (inpainting), создавать картины в режиме бесконечного полотна (outpainting).
Оценить возможности нейросети можно на странице Kandinsky 2.2, на платформе FusionBrain.AI, в Telegram-боте и боте соцсети «ВКонтакте», а также при помощи команды «Запусти художника» на умных устройствах Sber, в мобильном приложении «Салют».