Рубрика «распознавание речи» - 6

Google открывает API для распознавания речи на 80 языках - 1Компания Google сделала подарок сторонним разработчикам — и открыла доступ к программным интерфейсам Cloud Speech API. В первое время доступ предоставляется на бесплатной основе, тарифы объявят позже.

Распознавание речи работает для 80 языков. Возможно распознавание речи в прямом эфире через микрофон или аудиозаписей из файлов (вероятно, до 2 минут). Поддерживаются многочисленные форматы, в том числе FLAC, AMR и PCMU.

Теперь для любой программы можно встроить, например, голосовое управление через Cloud Speech API. Система выдаёт распознанный текст мгновенно в процессе работы.
Читать полностью »

«Мегафон» использует технологии распознавания речи «Яндекса» для работы виртуального консультанта, пишут «Ведомости» со ссылкой на представителей компаний. Стоимость сделки не раскрывают, но в «Яндексе» оценивают это как крупнейший в России контракт в этой сфере.

Пока проект реализован для Московского региона, Читать полностью »

Microsoft выложила на Github инструментарий CNTK для глубинного обучения - 1

Microsoft выложила в открытый доступ исходный код инструментов, которые используются в компании для ускорения разработок в области искусственного интеллекта: набор Computational Network Toolkit опубликован на Github.
Читать полностью »

Пиши голосом правильно - 1

Всем привет!

У многих из нас мало опыта в так называемом голосовом письме – на диктофон свои мысли раньше записывали разве что психоаналитики. Теперь диктовка становится привычнее – к ней приучил сервис голосового набора в смартфонах. Участвуя как product owner в процессе создания продукта для распознавания русской слитной речи, общаясь с разработчиками алгоритмов и с клиентами, проводя различные тесты систем распознавания, наблюдая за тем, как пользователи диктуют свои тексты и имея свой большой опыт ввода текста в компьютер с помощью голоса, я набрал много интересных наблюдений. Чтобы лучше понимать, как правильно пользоваться автоматическим распознаванием речи давайте посмотрим, как устроено распознавание речи. Описание будет очень упрощенным, но зато поможет понять, какие ошибки люди совершают при диктовке. И еще: данную статью я буду писать с помощью диктовки, внося правки с клавиатуры только в тех местах, где без этого будет не обойтись.
Читать полностью »

Хакатон от App in The Air - 1

Пару недель назад наша команда приняла участие в хакатоне, организованном командой App in The Air. О мероприятии я узнал во время беседы с Байрамом на одном из мероприятий для участников туриндустрии.

Смысл хакатона заключался в создании собственного виджета, который мог быть встроен в приложение App in The Air.
Изначально мы хотели дать пользователям возможность звонить и принимать звонки на борту самолета при условии интернет-доступа на борту. Исходили мы из того, что эта услуга будет востребована в первую очередь на рейсах, время полета которых составляет более 4-х часов.
Но потом, углубившись в тему, обнаружили, что правила полета запрещают использовать VoIP-сервисы через бортовой интернет.
Читать полностью »

image

На рынке коллтрекинга зреет революция: мы стоим на пороге внедрения технологии распознавания речи. Недавно она нашла применение в американских сервисах, как скоро тренд придет в Россию, какую выгоду получат владельцы бизнесов, рассказывает Евгений Власов — генеральный директор Calltouch.Читать полностью »

«Получаем» инвайт для голосового ассистента Hound - 1

Многие видели демо-видео персонального ассистента Hound, который по возможностям не уступает, и даже опережает такие известные приложения, как Google Now и Siri. Также Hound доступен свободно для скачивания на Google Play (на территории US), но, к сожалению, он находится в стадии разработки и требует инвайта при запуске.

У меня сразу зачесались руки срочно протестировать это чудо, и, устав ждать инвайта по почте (примерно через минуту), я взялся за дебаггер… который мне так и не понадобился, поскольку все оказалось проще, но об этом по порядку.
Читать полностью »

Пока еще Cortana не стала доступной для русскоговорящих пользователей Windows Phone 8.1, а это ожидается скоро, я предлагаю вам самим сделать веселое апрельское приложение, с помощью которого можно будет поговорить с телефоном, покомандовать им, а может быть и поиграть.

На деле это, оказывается, довольно просто.

Поговори со мной, Windows Phone - 1

В качестве примера предлагаю сделать детское приложение, которое тренирует в устном счете до 10-ти. Приложение будем писать на XAML/C#
Читать полностью »

Создан открытый аналог Siri — Sirius, доступный по лицензии BSD - 1

Группа Clarity Lab, находящаяся в университете Мичигана, предлагает решение с открытым исходным кодом для персонального компьютерного помощника. Их программа распознаёт голос и ищет ответы на запросы, точно как делают Siri от Apple, Google Now от Google, и аналогичные решения от Microsoft и Amazon. Проект под названием Sirius умеет даже больше, чем его аналоги – например, ему можно предоставить картинку и задать по ней вопрос.

Проект спонсируют Google, DARPA, американские военные и Национальный научный фонд США. Он распространяется по лицензии BSD, что означает полную открытость и бесплатность для всех желающих. Значит, любые стартапы смогут реализовать такую функциональность в своих проектах и устройствах.
Читать полностью »

Кажется, куда ни глянь, голосовое управление и диктовка добавляются во все приложения, операционные системы и игровые приставки. Нам нравится смеяться над тем, как плохо они работают, однако я решил погрузиться в тему с головой, для себя посмотреть на то, как это все работает, использовать голосовые функции… для всего. Вот что из этого получилось.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js