Команда СберБанка представила новую версию фирменной нейросети. Как отмечают в пресс-службе, обновлённая генеративная модель Kandinsky 2.1 способна за несколько секунд создавать высококачественные изображения по их текстовому описанию на «естественном» языке.
Нейросеть также может смешивать несколько рисунков, изменять их по текстовому описанию, генерировать изображения, похожие на заданное, дорисовывать недостающие части картинки и формировать изображения в режиме бесконечного полотна. Модель понимает запросы на 101 языке (включая русский и английский) и умеет рисовать в различных стилях.
В «Сбере» пояснили:
Теперь ваша очередь — попросите искусственный интеллект создать шедевр для вас. Введите текстовое описание в @kandinsky21_bot или сделайте запрос голосом. Для этого скажите ассистенту Салют «Запусти художника» на умных устройствах Sber и в Android-приложении Салют.
Новая модель Kandinsky 2.1 была дополнительно обучена на 170 миллионах пар «текст — изображение» высокого разрешения. Затем она дообучалась на отдельно собранном наборе из двух миллионов пар качественных изображений. В набор попали картинки с описаниями в таких традиционно сложных для нейросетей областях, как тексты и лица людей. В итоге Kandinsky 2.1 содержит 3,3 млрд параметров вместо двух миллиардов в Kandinsky 2.0.