Сегодня наше приложение для интерактивного написания и редактирования текста голосом Диктовка появилось в AppStore и Google Play. Его главная задача — продемонстрировать часть всех новых возможностей наших технологий для распознавания и синтеза речи. Именно об этих технологиях и о том, чем они интересны и уникальны, я хочу рассказать в этом посте.
Пара слов, чтобы вы понимали, о чём пойдёт речь. Яндекс уже давно предоставляет бесплатное мобильное API, которое можно использовать, например, для распознавания адресов и голосовых запросов к поиску. За этот год мы смогли довести его качество почти до того же уровня, на котором речь на эти темы распознают сами люди. И теперь мы делаем следующий шаг — модель для распознавания свободной речи на любую тему.
Кроме этого, наш синтез речи поддерживает некоторые эмоции. И, насколько нам известно, это пока первый коммерчески доступный синтез речи с такой возможностью.
Обо всём этом, а так же о некоторых других возможностях SpeechKit, включая активацию голосом, авторасстановку пунктуации с учётом артикуляции речи, распознавание смысловых объектов в речи, читайте ниже.
Читать полностью »