Рубрика «синтез речи» - 4

Всем привет.

По мотивам статьи «Самообслуживание клиентов с помощью google ASR»
Хотел бы вам рассказать, какие есть риски для бизнеса при использовании распознавания речи от Google для своего call-центра.

Я представляю компанию «Центр речевых технологий» (ЦРТ) и мы занимаемся технологиями синтеза и распознавания русской речи и в первую очередь, как раз делаем решения по автоматизации call-центров.
Речевыми технологиями мы занимаемся уже на протяжении 20 лет. Сейчас над этим трудится порядка 70-80 ученых и программистов, плюс нам помогают речевые кафедры ведущих ВУЗов страны, плюс у нас есть собственная кафедра речевых технологий в ИТМО — растим своих молодых ученых.

И в этом посте я проведу параллели между распознаванием речи от ЦРТ и Google, относительно применения его в корпоративном секторе (call — центры).
Читать полностью »

Всем привет.
По роду своей профессиональной деятельности я занимаюсь внедрением проектов на основе речевых технологий. Это синтез и распознавание речи, голосовая биометрия и анализ речи.
Мало кто задумывается, насколько эти технологии уже присутствуют в нашей жизни, хоть и далеко не всегда – явно.
Постараюсь популярно объяснить вам, как это работает и зачем это вообще нужно.
Подробно начну с распознавания речи, т.к. это более близкая к повседневной жизни штука, с которой многие из нас встречались, а некоторые уже постоянно пользуются.
Читать полностью »

Электронные вычислительные средства, на сегодняшний день, достаточно плотно интегрированы в нашу повседневную жизнь, но о том, каков потенциал этих самых средств и как мы можем его использовать, многие из нас не догадываются; либо догадываются, но находят сложным для неспециалиста. Я хочу рассказать о своём опыте расширения функциональных возможностей моей домашней электроники.
Читать полностью »

Приложение «Читатель». Русский синтез речи на iPhone, iPad и iPod

Дорогие пользователи Хабра. Мы хотим вам представить лучший на сегодняшний день русский синтез речи на iOS — приложение «Читатель», работающее полностью на устройстве (без подключения к интернету). Теперь любой текст вы можете превратить в аудиокнигу.
Поддерживаемые форматы — txt, doc, rtf, fb2.
Поддерживается режим добавления собственных закладок на сайты с книгами.
Работает в фоне, управляется с гарнитуры.
Можно открывать текстовые файлы из Safari и почты в приложении.
Добавление файлов через iTunes без дополнительной синхронизации.

Читать полностью »

Данный материал представляет из себя обзор основных вспомогательных технологий, обеспечивающих доступ к компьютерной технике пользователям с различными нарушениями зрения. Здесь будут рассмотрены главные концепции реализации альтернативного представления экранной информации для обеспечения её доступности людям с отсутствующим или ослабленным зрением.

Главным образом, статья ориентирована на обычных пользователей и преследует цель донести до широкой массы людей информацию о том, что и незрячий или слабовидящий человек может работать с компьютерной техникой, а также осветить общие принципы этого процесса. Кроме того, материал может оказаться полезным для тех, кто сам имеет проблемы подобного рода, так как может помочь им снизить нагрузку на зрительную систему или, при дальнейшем неблагоприятном развитии ситуации, облегчить процесс реабилитации, однако автор надеется, что последних будет как можно меньше.
Читать полностью »

26 мая 2012 в Санкт-Петербурге пройдет первая конференция AINL: Искусственный интеллект и естественный язык. Основные темы и направления: распознавание и синтез речи, искусственный интеллект и диалоговые системы, инженерия знаний и онтологии, извлечение данных и data mining.
Конференция будет длиться один день, официальный язык — русский.
Сейчас мы формируем программу и приглашаем докладчиков.

image
Читать полностью »

26 мая 2012 в Санкт-Петербурге пройдет первая конференция AINL: Искусственный интеллект и естественный язык. Основные темы и направления: распознавание и синтез речи, искусственный интеллект и диалоговые системы, инженерия знаний и онтологии, извлечение данных и data mining.
Конференция будет длиться один день, официальный язык — русский.
Сейчас мы формируем программу и приглашаем докладчиков.

image
Читать полностью »

Теперь, для вывода текста в речь на платформе Asterisk PBX с открытым источником, можно будет использовать переводчик Microsoft.

image

Представленный скрипт позволит использовать Microsoft Translator для воспроизведения текста пользователя в речь. Он включает в себя локальное кэширование на голосовые данные, содержит в своей базе множество языков, а также поддерживает 8 кГц или 16 кГц ставки. Это обеспечит наилучшее качество звучания, наряду с использованием широкополосных кодеков.

Читать полностью »

Теперь, для вывода текста в речь на платформе Asterisk PBX с открытым источником, можно будет использовать переводчик Microsoft.

image

Представленный скрипт позволит использовать Microsoft Translator для воспроизведения текста пользователя в речь. Он включает в себя локальное кэширование на голосовые данные, содержит в своей базе множество языков, а также поддерживает 8 кГц или 16 кГц ставки. Это обеспечит наилучшее качество звучания, наряду с использованием широкополосных кодеков.

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js