15 октября торжественно запустится единая видеоплатформа MRG на базе видео ВКонтакте.
VK Видео — новая видеоплатформа, которая объединяет ВКонтакте, ОК и другие видеосервисы единой экосистемы с точки зрения подхода и контента. Пользователям будут доступны передовые технологии и миллионы качественных оригинальных видео на любой вкус.
Запуск будет сопровождаться мероприятием в ВТБ Арена Парк на Ленинградском проспекте, компания обещает «презентовать важные технические обновления», рассказать про монетизацию видео и работу с правообладателями.
Новый видеосервис будет включать ленту коротких видео на основе Клипов ВК, трансляции, пользовательский и профессиональный контент и заменит видеоплеер «Одноклассников».
Объединение технологий в основную видеоплатформу поможет избежать ресурсозатратной конкуренции между сервисами Mail.ru Group и поучаствовать в реализации призыва российских властей к построению отечественной альтернативы YouTube. Rutube действующей альтернативой пока не считается, по крайней мере, с точки зрения главы комитета по информационной политике и информационным технологиям Александра Хинштейна.
Одно из технических обновлений сегодня было презентовано пресс-службой ВКонтакте, это автоматическая генерация субтитров на русском языке.
Они созданы на базе собственных технологий соцсети по распознаванию речи, алгоритмов машинного обучения единой видеоплатформы и технологий интеллектуального шумоподавления единой платформы видеозвонков.
Новая технология автоматически генерирует текст, расставляет знаки препинания и заглавные буквы, распределяет текст по кадрам и обеспечивает точность появления субтитра в момент произнесения фразы. В отличие от существующих решений на рынке, технология ВКонтакте умеет проставлять в субтитрах знаки препинания и заглавные буквы, а в ближайшем будущем научится разделять речь спикеров на разные реплики. Всё это значительно повышает понятность расшифровки и упрощает чтение во время просмотра видео.
Соцсеть ведёт тестирование и дообучение новой технологии: субтитры в экспериментальном режиме уже доступны части аудитории в популярных роликах и видео из верифицированных сообществ в веб-версии и мобильном приложении ВКонтакте.
Аудиопоток проходит четыре этапа обработки. Сначала запись очищается от фоновых звуков с помощью уникальной технологии интеллектуального шумоподавления — это позволяет лучше определять речь не только на профессиональных видео, но и на любительских роликах. Затем нейросеть распознаёт слова и формирует из них текст. На третьем этапе подключается пунктуационная модель: она расставляет знаки препинания и заглавные буквы. Эти решения ВКонтакте ранее применила для распознавания аудиосообщений, а для работы с видео к ним добавили ещё один шаг: методы машинного обучения распределяют текст по кадрам, чтобы фраза появлялась точно в момент, когда говорящий её произносит.
Особое внимание уделено и производительности технологии автоматических субтитров. Инфраструктурные ресурсы используются максимально эффективно, что помогает обрабатывать все загруженные видео и быстро генерировать субтитры для новых роликов.
В ближайшее время смотреть видео с субтитрами станет ещё удобнее. Технология создания автоматических субтитров дополнится диаризацией — это процесс, в котором аудиопоток делится на реплики в соответствии с конкретным спикером. Благодаря диаризации, фразы разных людей в расшифровке будут самостоятельными, даже если собеседники общаются без заметных пауз.