Главная

Метка «dtw»

Распознавание речи для чайников

2014-06-13 в 6:13, admin, рубрики: DCT, dtw, mfcc, speech recognition, Алгоритмы, Программирование, метки: DCT, dtw, mfcc, speech recognition

В этой статье я хочу рассмотреть основы такой интереснейшей области разработки ПО как Распознавание Речи. Экспертом в данной теме я, естественно, не являюсь, поэтому мой рассказ будет изобиловать неточностями, ошибками и разочарованиями. Тем не менее, главной целью моего «труда», как можно понять из названия, является не профессиональный разбор проблемы, а описание базовых понятий, проблем и их решений. В общем, прошу всех заинтересовавшихся пожаловать под кат!

Читать полностью »

Космические циклы в радиоактивном распаде

2014-06-09 в 6:34, admin, рубрики: dtw, python, Алгоритмы, биофизика, космонавтика, физика, метки: dtw, python, биофизика

Добрый день Хабр. Пишу сюда, потому что некоторым может быть интересен метод Dynamic Time Warping
не только в распозновании речи и временных рядов, но как применение и в сугубо научных методах.

В далеких 50-х годах 20 века радиолог Симон Шноль из Пущинского Института теоретической и экспериментальной биофизики и МГУ в попытках уменьшить разброс результатов
при возможно более точном выполнении измерений скорости гидролиза АТФ катализируемой белками актомиозинового коплекса натолкнулся на необъяснимою
сходность гистограмм (графики плотности вероятности) одновременных, но находящихся в разных точках лаборатории измерений.

Как плотности вероятности могут быть похожи? Очень просто, если представить, что любое реальное измерение обладает помехами по
отношению к любым проектированиям гипотез распределения.

Читать полностью »

Мел-кепстральные коэффициенты (MFCC) и распознавание речи

2012-03-28 в 5:52, admin, рубрики: dsp, dtw, mfcc, Алгоритмы, Программирование, Работа со звуком, распознавание речи, метки: dsp, dtw, mfcc, распознавание речи

Недавно я наткнулся на интересную статью, опубликованную rgen3, в которой описан DTW-алгоритм распознавания речи. В общих чертах, это сравнение речевых последовательностей с применением динамического программирования.

Заинтересовавшись темой, я попробовал применить этот алгоритм на практике, но на этом пути меня поджидало некоторое количество граблей. Прежде всего, что именно нужно сравнивать? Непосредственно звуковые сигналы во временной области — долго и не очень эффективно. Спектрограммы — уже быстрее, но не намного эффективнее. Поиски наиболее рационального представления привели меня к MFCC или Мел-частотным кепстральным коэффициентам, которые часто используются в качестве характеристики речевых сигналов. Здесь я попытаюсь объяснить, что они из себя представляют.Читать полностью »

Публикации RSS | Комментарии RSS

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js

Информация

Обсуждаемое

Рекомендуем

Метка «dtw»

Распознавание речи для чайников

Космические циклы в радиоактивном распаде

Мел-кепстральные коэффициенты (MFCC) и распознавание речи

Архив

Информация

Обсуждаемое

Рекомендуем

Метка «dtw»

Распознавание речи для чайников

Космические циклы в радиоактивном распаде

Мел-кепстральные коэффициенты (MFCC) и распознавание речи

Новости

Актуальные темы

Архив