Рэй Курцвейл — один из самых именитых футурологов и специалистов по искусственному интеллекту. Он занимается технологиями распознавания речи с 70-х годов прошлого века. Он создал несколько успешных компаний, основанных не технологиях искусственного интеллекта, а в 90-е увлёкся футурологией и написал несколько книг, ставших бестселлерами — «Эпоха мыслящих машин», «Эпоха духовных машин», «Сингулярность уже близка». Курцвейл активно занимается обоснованием наступления технологической сингулярности.
Читать полностью »
Рубрика «распознавание речи» - 10
Рэй Курцвейл стал техническим директором Google
2012-12-15 в 10:53, admin, рубрики: Google, искусственный интеллект, Исследования и прогнозы в IT, машинное обучение, распознавание речи, рэй курцвейл, технологическая сингулярность, метки: машинное обучение, распознавание речи, рэй курцвейл, технологическая сингулярностьУмрет ли слитное письмо?
2012-11-23 в 10:51, admin, рубрики: Блог компании ASUS Russia, письмо, распознавание речи, распознавание текста, метки: письмо, распознавание речи, распознавание текста Под натиском информационных технологий абсолютно привычные и понятные вещи начинают забываться и приходить в упадок. Думаю, все помнят часы, проведенные над прописью, в попытках вывести ровные контуры букв. Многие педагоги старой советской школы считают, что слитное письмо развивает мелкую моторику и, как следствие, интеллект. Но правительство США решило по-другому: с прошлого года пропись стала необязательным предметом и школы могут принимать работы учеников, написанные печатными буквами: школьники будут писать лишь печатными буквами. Давайте постараемся разобраться, почему это произошло и как современные технологии поддерживают печатные буквы.
Читать полностью »
IBM Watson составит конкуренцию Siri
2012-09-03 в 12:23, admin, рубрики: ibm watson, siri, аналитика, интерфейсы, искусственный интеллект, Поисковые машины и технологии, распознавание речи, метки: ibm watson, siri, аналитика, распознавание речи Суперкомпьютер IBM Watson уже успел прославиться тем, что обыграл чемпионов телевикторины Jeopardy. Учитывая, что эта викторина известна в России как «Своя Игра», в каком-то смысле Watson не глупее Анатолия Вассермана. Основное назначение суперкомпьютера — аналитика в финансовой и медицинской сфере. Вице-президент IBM по инновациям Берни Майерсон заявил на прошлой неделе, что в планах корпорации — вывести Watson на потребительский рынок, научив его понимать устную речь и снабдив общеупотребительными знаниями. Таким образом, Watson можно будет использовать с помощью мобильного приложения, так же как и Siri.
Читать полностью »
Простой алгоритм распознавания речи по короткому словарю на основе MFCC
2012-08-31 в 16:20, admin, рубрики: c++, Песочница, Программирование, распознавание речи, метки: c++, Программирование, распознавание речиПриветствую всех читателей habrahabr!
В последнее время наблюдается значительный рост интереса к технологиям, связанным с распознаванием речи. Можно назвать несколько причин этого роста, в частности, значительное рост вычислительных возможностей и обучающего материала. На хабрахаре пользователем domage был опубликован целый цикл статей по основам технологий распознавания речи. Также стоит отметить статью Мел-кепстральные коэффициенты (MFCC) и распознавание речи и выполненную на её основе работу по идентификации человека по голосу: Кто там? — Идентификация человека по голосу.
В данной работе предлагается простой алгоритм (и его реализация на C++) системы распознавания речи по короткому словарю, основанный на анализе статистического распределения мел-кепстральных коэффициентов (Mel-frequency cepstrum coefficients, MFCC).
Читать полностью »
Распознавание голоса на STM32F4-Discovery
2012-06-25 в 15:46, admin, рубрики: diy или сделай сам, STM32F4, Программинг микроконтроллеров, распознавание речи, метки: STM32F4, распознавание речи
В этой статье я хочу рассказать о том, как можно распознавать речь на микроконтроллере, используя отладочную плату STM32F4-Discovery. Поскольку распознавание речи — достаточно сложная задача даже для компьютера, то в данном случае оно проводится при помощи сервиса Google. Распознавание речи таким способом может пригодится в разных задачах, например в одном из устройств «умного дома».
Читать полностью »
Мы будем когда-либо… проходить тест Тьюринга для компьютеров?
2012-06-04 в 14:47, admin, рубрики: Блог компании GlobaTel (ООО «Глобальные Телекоммуникации»), будущее, ИИ, искуственный интеллект, разработка, распознавание речи, тест тьюринга, хостингПриветствуем Вас уважаемые!
Чем больше мы размышляем над будущим наших услуг, тем больше хочется мечтать о колонизации космоса и искусственном интеллекте. Все большие шаги делаются в сторону Марса и небольшие шаги, типа интерфейса Siri от Apple делаются в сторону ИИ.
Поэтому, несомненно, вся IT-индустрия будет двигаться именно в данном ключе, хоть и в нашей области хостинга консерватизм и надежность должны быть на первом месте.
Одним словом, будем стараться разбавлять «конкретные» статьи, статьями наполненными капелькой «мечты».
Идентификация пользователя по голосу
2012-05-25 в 17:24, admin, рубрики: speech recognition, Алгоритмы, идентификация говорящего, Программирование, Работа со звуком, распознавание речи, метки: speech recognition, идентификация говорящего, распознавание речиПродолжая тему распознавания голоса, хочу поделится своей старой дипломной работой, на которую одно время возлагал надежды по доведению до коммерческого продукта, но потом оставил этот проект, выложив его в сеть на радость другим студентам. Хотя возможно эта тема будет интересна не только в академическом ключе, а и для общего развития.
Тема моей дипломной работы была «Разработка подсистемы САПР защиты от несанкционированного доступа на основе нейросетевого анализа спектральных характеристик голоса». В самом дипломе конечно много воды вроде ТБ, экономики и прочего, но есть и математическая и практическая часть, а также анализ существующих аналогичных решений. В конце выложу программу и сам диплом, возможно еще кому-то пригодится.
Читать полностью »
Кто там? — Идентификация человека по голосу
2012-05-24 в 21:01, admin, рубрики: mfcc, speech recognition, Алгоритмы, идентификация говорящего, Программирование, Работа со звуком, распознавание речи, метки: mfcc, speech recognition, идентификация говорящего, распознавание речи
Здравствуй, дорогой читатель!
Предлагаю твоему вниманию интересную и познавательную статью об отдельно взятом методе распознавания говорящего. Всего каких-то пару месяцев назад я наткнулся на статью о применении мел-кепстральных коэффициентов для распознавании речи. Она не нашла отклика, вероятно, из-за недостаточной структурированости, хотя материал в ней освещен очень интересный. Я возьму на себя ответственность донести этот материал в доступной форме и продолжить тему распознавания речи на Хабре.
Под катом я опишу весь процесс идентификации человека по голосу от записи и обработки звука до непосредственно определения личности говорящего.Читать полностью »
Разработка русскоязычного аналога «Siri»: эпилог
2012-05-13 в 7:45, admin, рубрики: apple, siri, speech recognition, разработка под iOS, распознавание речи, метки: siri, speech recognition, разработка под iOS, распознавание речи Или история, как небольшой эксперимент Just for fun перерос в полноценное приложение с неплохим результатом.
Начало истории тут, продолжение тут.
Если коротко, то с четвертого раза apple одобрил приложение, основательно покромсав функционал и дизайн. Подробности про прохождение ревю, и первые результаты под катом.Читать полностью »
Один день для искусственного интеллекта и естественного языка
2012-04-23 в 11:23, admin, рубрики: natural language processing, siri, watson, диалоговые системы, искусственный интеллект, Компьютерная лингвистика, конференция, обработка текстов, распознавание речи, синтез речи, метки: natural language processing, siri, watson, диалоговые системы, искусственный интеллект, Компьютерная лингвистика, конференция, обработка текстов, распознавание речи, синтез речи 26 мая 2012 в Санкт-Петербурге пройдет первая конференция AINL: Искусственный интеллект и естественный язык. Основные темы и направления: распознавание и синтез речи, искусственный интеллект и диалоговые системы, инженерия знаний и онтологии, извлечение данных и data mining.
Конференция будет длиться один день, официальный язык — русский.
Сейчас мы формируем программу и приглашаем докладчиков.