Немного предыстории
Два года назад мы выпустили для iOS первую версию «Читателя» (Ссылка на iTunes). Это мобильное приложение, которое читает вслух загруженные в него книги и текстовые документы с помощью технологии синтеза русской речи. По сути дела, он позволяет озвучить в реальном времени любую книгу (.txt, .doc, .fb2). Книги озвучиваются прямо в мобильном устройстве, постоянный доступ в интернет при этом не нужен. За это время «Читатель» установили порядка 100 тысяч пользователей.
Новое в приложении
В «Читателе» обновился дизайн. Появилась поддержка последней версии iOS. Поработали над эргономикой и навигацией с учетом комментариев наших пользователей.
Сделали возможность установки дополнительных голосов. Пока их только 4 (2 мужских и 2 женских), но в следующем обновлении мы планируем сделать поддержку уже семи голосов.
Также мы добавили возможность работы со шрифтом – можно выбирать стиль шрифта и менять его размер.
Дальнейшие планы
Мы планируем расширять функциональность и улучшать удобство использования, учитывая поступающие пожелания и комментарии наших клиентов в AppStore.
В ближайших планах внедрение озвучки английского языка (до конца 2014 года), и поддержка казахского – она будет реализована в 2015 году.
Сейчас ведется разработка «Читателя» под Android и мы планируем выложить его в Google Play уже к концу сентября. Также подготавливается plug-in приложение для легкого встраивания нашего синтеза в другие приложения и сторонние читалки.
О технологии синтеза речи
Наша технология синтеза речи использует оригинальную гибридную реализацию нескольких известных технологий: Unit Selection и статистическое моделирование речевых параметров на основе скрытых марковских моделей (HMM). Первая из них обеспечивает естественный тембр звучания синтезированного голоса, а вторая позволяет придать голосу необходимую интонационную, смысловую и эмоциональную окраску.
Кроме естественности тембра и интонации голоса, синтезатор речи способен понимать смысл текста в зависимости от контекста, обеспечивая правильное произношение в неоднозначных ситуациях за счет широкого объема словаря, аббревиатур, сокращений и много другого.
Полезная информация
Недавно мы сделали SDK TTS под Android и iOS – так что теперь нашу технологию синтеза речи можно использовать в сторонних мобильных приложениях. Интересно? Пишите voicefabric@speechpro.ru
Ещё есть возможность озвучивать интернет сайты и видео-ролики нашим синтезом, для этого мы запустили отдельный проект: VoiceFabric.ru
Автор: DemiurgeSerge