Главная

Рубрика «распознавание аудио»

Случайный лес vs нейросети: кто лучше справится с задачей распознавания пола из аудио (ч.1)

2017-07-26 в 8:16, admin, рубрики: neurodata lab, Блог компании Neurodata Lab, нейросети, Работа со звуком, распознавание аудио

Исторически сложилось так, что наибольшего успеха глубокое обучение достигло в задачах image processing – распознавания, сегментации и обработки изображений. Однако не сверточными сетями едиными, как говорится, живет наука о данных.

Мы попробовали составить гайд по решению задач, связанных с обработкой речи. Самой популярной и востребованной из них является, вероятно, распознавание того, что именно говорят, анализ на семантическом уровне, но мы обратимся к более простой задаче – определению пола говорящего. Впрочем, инструментарий в обоих случаях оказывается практически одинаков.

Читать полностью »

Публикации RSS | Комментарии RSS

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js

Информация

Комментарии

Рекомендуем

Рубрика «распознавание аудио»

Случайный лес vs нейросети: кто лучше справится с задачей распознавания пола из аудио (ч.1)