Команда «ВКонтакте» сообщила хорошую новость для сторонних разработчиков. Теперь разработчики смогут бесплатно использовать в своих проектах технологию «ВКонтакте», которая считывает голос и переводит его в текст.
Об этом рассказал технический директор «ВКонтакте» Александр Тоболь на открытии конференции Saint HighLoad++. Технология распознавания речи, или ASR, Automatic Speech Recognition, внедряется в несколько нажатий. Нейросети хорошо справляются с аудио с посторонними шумами, большим количеством сленга и сокращений.
Для распознавания можно выбрать одну из двух моделей. Нейтральная подойдёт для разборчивой речи, как в телешоу или интервью, а спонтанная поможет, когда нужно обработать более обыденную речь со сленгом и ненормативной лексикой. Нейросети «ВКонтакте» обрабатывают файлы за несколько секунд, умеют удалять из расшифровки шумы и паузы, понимают неразборчивую речь и даже отдельный звук «ъ».
Технологию можно попробовать через веб-интерфейс на специальной странице или интегрировать через публичный API «ВКонтакте». На портале доступен широкий набор методов, с помощью которых можно создавать мини-приложения «ВКонтакте» или использовать в сторонних проектах. Версию с обработкой аудио до 100 минут в сутки можно применять для любых целей. А для безлимитного использования технологии можно отправить заявку на электронную почту.