Команда СберБанка скоро существенно расширит возможности фирменной генеративной нейросети GigaChat. Пользователи GigaChat смогут генерировать музыкальные треки по произвольным текстовым запросам. Об этом рассказал вице-президент по цифровым поверхностям «Салют» Сбербанка Денис Филиппов в рамках международной конференции по искусственному интеллекту AI Journey 2023.
Для генерации музыки человеку будет достаточно сформулировать задачу, например: «Сочини весёлую музыку в стиле кантри» или «Напиши трек для лаундж-зоны бизнес-центра». В ответ GigaChat будет выдавать аудиофайл с уникальной музыкальной композицией и нотную партитуру в формате MIDI, который понимает любая DAW (Digital Audio Workstation).
Пользователь сможет прослушать и скачать получившийся трек, а MIDI-файл использовать в собственных творческих проектах.
Генерация музыки в GigaChat возможна благодаря интеграции нейросетей CLaMP и SymFormer. Для обучения SymFormer использовались платформа ML Space на базе суперкомпьютера Christofari и датасет более чем из 200 тысяч композиций разных стилей: от классики до современной электронной музыки и рока.
Денис Филиппов рассказал:
Новые возможности GigaChat будут полезны не только музыкальным энтузиастам и представителям творческих профессий. Одним из сегментов целевой аудитории сервиса мы видим представителей среднего и малого предпринимательства. Благодаря GigaChat они смогут быстро, качественно и, что важно, абсолютно легально решать задачи бизнеса: создавать фоновое музыкальное сопровождение для кафе, салонов красоты и залов ожидания, генерировать треки для рекламных видеороликов и соцсетей.