Всем привет.
По роду своей профессиональной деятельности я занимаюсь внедрением проектов на основе речевых технологий. Это синтез и распознавание речи, голосовая биометрия и анализ речи.
Мало кто задумывается, насколько эти технологии уже присутствуют в нашей жизни, хоть и далеко не всегда – явно.
Постараюсь популярно объяснить вам, как это работает и зачем это вообще нужно.
Подробно начну с распознавания речи, т.к. это более близкая к повседневной жизни штука, с которой многие из нас встречались, а некоторые уже постоянно пользуются.
Читать полностью »
Метка «распознавание речи» - 2
Речевые технологии. Распознавание слитной речи для чайников на примере IVR систем
2013-06-27 в 7:38, admin, рубрики: ip-телефония, ivr, биометрия, Работа со звуком, распознавание речи, речевые технологии, синтез речи, телефония, метки: ivr, биометрия, распознавание речи, речевые технологии, синтез речиУправление голосом в приложениях на Android
2013-05-22 в 5:55, admin, рубрики: android, будущее здесь, Песочница, Разработка под android, распознавание речи, метки: android, распознавание речи
Началось все с того, что я посмотрел неплохой обзор (сравнение) Siri и Google Now. Кто из них лучше, спорить не буду, однако у меня лично планшет на Андроиде. Я подумал, а что если написать калькулятор полностью на голосовом управлении (удобно ли будет?). Но для начала пришлось немного разобраться с самим голосовым управление, точнее говоря с голосовым вводом (управления еще добиться надо). Кроме того, я только что скачал Android Studio, и мне не терпелось скорей опробовать ее на практике (ну на минипроекте). Что ж, начнем.
«Центр речевых технологий» предоставляет речевые базы для создания прототипа системы распознавания речи
2013-04-19 в 9:22, admin, рубрики: c++, Алгоритмы, Программирование, распознавание речи, центр речевых технологий, црт, метки: распознавание речи, центр речевых технологий, цртС целью найти талантливых специалистов, готовых посвятить себя деятельности по развитию речевых технологий в России, Центр речевых технологий (ЦРТ) предоставляет собственные речевые базы. Они содержат не просто звуковые файлы с текстовками, но и разметку по времени, выполненную специалистами ЦРТ. Читать полностью »
Компанией «Центр речевых технологий» объявлен конкурс на создание системы распознавания слитной русской речи
2013-03-22 в 9:47, admin, рубрики: конкурс, Работа со звуком, разработка, распознавание речи, метки: конкурс, работа со звуком, разработка, распознавание речиПриветствую тебя, читатель habrahabr!
Спешу поделиться с тобой новостью:
Компания «Центр речевых технологий» совместно с НИУ ИТМО объявили конкурс на создание полноценной системы распознавания слитной русской речи. Главный приз составляет 100 000 рублей. Всем участникам конкурса будет предоставлена речевая база для обучения и настройки. Кроме того, участникам будет доступна консультация специалистов в области распознавания речи. Подробности см. здесь:
Конкурс «Родная речь — 2013»: система распознавания русской речи за месяц!
Pocketsphinx. Распознавание речи и голосовое управление в Linux
2013-02-25 в 16:12, admin, рубрики: linux, pocketsphinx, голосовое управление, звук, Работа со звуком, распознавание речи, Софт, метки: linux, pocketsphinx, голосовое управление, звук, распознавание речи— Всё в порядке, Лёня?
Динамики отрегулированы на максимум, я морщусь, отвечаю:
— Да. Тише звук.
— Звук — тише, — соглашается «Виндоус-Хоум», — тише, тише…
— Хватит, Вика
С.Лукьяненко, «Лабиринт отражений»
Введение
В 1997-ом году Лукьяненко пророчил для десктопа сочетание CLI и голосового управления. Однако сейчас голосовое управление — достаточно узкая ниша.
Голосовое управление — взаимодействие с устройством при помощи звуковых команд. Не путайте это понятие с распознаванием речи. Для голосового управления достаточно, чтобы устройство реагировало на единственную нужную команду (ведь ваша собака не может работать машинисткой?). Распознавание речи — гораздо более глобальная проблема: в этом случае устройство должно преобразовывать в текстовый формат все слова, произнесенные вами. Как легко догадаться, распознавание речи на данный момент реализовано поверхностно относительно человеческих возможностей.
Функционал, рассмотренный в статье, может быть применен, к примеру, для организации модного сейчас «умного дома» или просто управления компьютером. Честно говоря, для описания управления компьютером хватило бы пары абзацев, но я попытаюсь показать вам основы работы с CMU Sphinx.
Кстати, процентов 70 описанного здесь подойдет и пользователям Windows.
Читать полностью »
PixelTone: прототип графического редактора с голосовым управлением
2013-02-20 в 12:26, admin, рубрики: adobe, голосовое управление, интерфейсы, обработка изображений, распознавание речи, ретушь, метки: голосовое управление, распознавание речи, ретушьВ Мичиганском университете совместно с Adobe Research создали прототип графического редактора, управляемого голосом и жестами. Прототип, названный PixelTone, пока умеет делать лишь самые простые операции и жесты. Он понимает простые команды и ориентируется в описательных терминах вроде «верх», «низ», «ярче», «темнее». Кроме того, он может запоминать названия объектов и имена людей на фотографиях, что позволяет использовать команды вроде «Сделай Васю чуть контрастнее».
Фишки youtube: распознавание речи (в текст), автоматические субтитры
2013-01-24 в 12:10, admin, рубрики: Google, YouTube, Работа со звуком, распознавание речи, субтитры, метки: youtube, распознавание речи, субтитрыКорпорация Добра не перестает удивлять. Уже слышал ранее как на базе разработок гугла можно распознавать речь в текст. В свое время очень сильно интересовался этим вопросом, искал решения (программные и не только). Но достойных продуктов под руку не попадалось. Как уже узнал позже, все подобные системы используются спецслужбами и военными. Но дело сейчас не в этом.
Обнаружил, что на всех свежих видео появилась кнопка Текст видеоЧитать полностью »
Распознавание речи для iOS
2012-12-18 в 21:28, admin, рубрики: speech recognition, разработка под iOS, распознавание речи, метки: speech recognition, распознавание речи
Недавно у меня возникла идея написать виртуального бота для общения. И хотя таковые уже существуют — речь пойдет не о приложении. Для претворения замысла в жизнь нужна была библиотека для распознавания голоса, и я стал искать. О результатах поиска далее.
Читать полностью »
Рэй Курцвейл стал техническим директором Google
2012-12-15 в 10:53, admin, рубрики: Google, искусственный интеллект, Исследования и прогнозы в IT, машинное обучение, распознавание речи, рэй курцвейл, технологическая сингулярность, метки: машинное обучение, распознавание речи, рэй курцвейл, технологическая сингулярность Рэй Курцвейл — один из самых именитых футурологов и специалистов по искусственному интеллекту. Он занимается технологиями распознавания речи с 70-х годов прошлого века. Он создал несколько успешных компаний, основанных не технологиях искусственного интеллекта, а в 90-е увлёкся футурологией и написал несколько книг, ставших бестселлерами — «Эпоха мыслящих машин», «Эпоха духовных машин», «Сингулярность уже близка». Курцвейл активно занимается обоснованием наступления технологической сингулярности.
Читать полностью »
Умрет ли слитное письмо?
2012-11-23 в 10:51, admin, рубрики: Блог компании ASUS Russia, письмо, распознавание речи, распознавание текста, метки: письмо, распознавание речи, распознавание текста Под натиском информационных технологий абсолютно привычные и понятные вещи начинают забываться и приходить в упадок. Думаю, все помнят часы, проведенные над прописью, в попытках вывести ровные контуры букв. Многие педагоги старой советской школы считают, что слитное письмо развивает мелкую моторику и, как следствие, интеллект. Но правительство США решило по-другому: с прошлого года пропись стала необязательным предметом и школы могут принимать работы учеников, написанные печатными буквами: школьники будут писать лишь печатными буквами. Давайте постараемся разобраться, почему это произошло и как современные технологии поддерживают печатные буквы.
Читать полностью »