Команда СберБанка поделилась свежими новостями о развитии проекта фирменной нейросети — бесплатной генеративной модели Kandinsky, которая создаёт изображения по текстовому описанию на русском и английском языках. Обновлённая версия Kandinsky 3.1 дообучена на увеличенном наборе изображений, что позволило повысить качество сгенерированного контента. Первым доступ к Kandinsky 3.1 получил ограниченный круг пользователей: художники, дизайнеры и блогеры.
Первый заместитель председателя правления Сбербанка Александр Ведяхин рассказал:
Сегодня ровно год, как вышла версия Kandinsky 2.1. За это время мы постоянно развивали нашу нейросеть, которая помогает людям создавать новые образы и даёт абсолютно каждому феноменальные возможности для творчества. По сравнению с предыдущей моделью Kandinsky 3.1 стал ещё быстрее, удобнее и реалистичнее. Kandinsky 3.1 — это гибкий, многофункциональный и абсолютно бесплатный инструмент, который превратит любого человека в художника и творца. Скоро все желающие смогут протестировать новые возможности нейросети. Как и предыдущие версии, модель будет бесплатной и доступна на разных поверхностях.
Одной из ключевых особенностей версии стала более высокая скорость генерации картинок: время генерации сократилось почти в 10 раз, а разрешение можно повысить до 4K. Также появилась возможность улучшения текстового запроса с помощью языковой модели. Пользователям доступны функции создания различных вариаций изображений, смешивание картинок и текста, создание пакетов стикеров и возможность вносить локальные изменения на картинке, не меняя всей композиции сцены (ControlNet).
Также в ближайшее время появится новая модель Kandinsky Video 1.1 для генерации видео по текстовым описаниям. Она повысит качество генерации, а также увеличит разрешение видео в два раза по сравнению с Kandinsky Video 1.0.