Рубрика «распознавание речи» - 3

Глубокие нейронные сети для автоматической оценки звонков

2018-11-02 в 14:11, admin, рубрики: deep neural networks, speech recognition, Блог компании Voximplant, глубокие нейронные сети, звук, машинное обучение, Программирование, распознавание речи

Оценка звонков – ключевая часть контроля качества для колл-центров. Она позволяет организациям тонко подстраивать рабочий процесс, чтобы операторы могли выполнять работу быстрее и эффективнее, а также избегать бессмысленной рутины.

Памятуя о том, что колл-центр должен быть эффективным, мы работали над автоматизацией оценки звонков. В итоге мы придумали алгоритм, который обрабатывает звонки и распределяет их на две группы: подозрительные и нейтральные. Все подозрительные звонки сразу же отправлялись в команду оценки качества.

Глубокие нейронные сети для автоматической оценки звонков - 1

Читать полностью »

AlterEgo: девайс, который умеет читать (некоторые) мысли

2018-08-02 в 10:59, admin, рубрики: Блог компании Everyday Tools, будущее здесь, искусственный интеллект, машинное обучение, Научно-популярное, носимые гаджеты, распознавание речи

В начале апреля научный сотрудник Массачусетского технологического института Арнав Капур двадцати четырех лет добавил на YouTube короткое видео. В ролике показано, как он гуляет по студенческому городку, переходя из одной локации в другую; на правой стороне лица у него закреплено белое пластиковое приспособление.

AlterEgo: девайс, который умеет читать (некоторые) мысли - 1

Сначала он проходит мимо ряда велосипедов, припаркованных возле подтаявших сугробов, губы у него сомкнуты, а на экране высвечиваются не озвученные мысли. Появляется надпись: «Время?», и мужской голос отвечает: «Десять часов тридцать пять минут». В следующей сцене Капур делает покупки в местном магазине. Цена каждого товара, который он бросает в корзину (туалетная бумага, сэндвич по-итальянски, консервированные персики) отображается на экране. «Общая сумма — 10.07 $», — отзывается мужской голос. В последней сцене Капур двигает по экрану курсор, по всем признакам силой мысли.

Капур приехал из Нью-Дели, чтобы устроиться в Media Lab Массачусетского технологического института и создавать носимые устройства, которые органично интегрировали бы технологии в нашу повседневную жизнь. Чтобы больше не тянуться за телефоном, не стоять уставившись в экран, не ходить с опущенными глазами и не выпадать из реальности, чтобы включиться в процесс.

Это прозвучит неправдоподобно, но AlterEgo — девайс, работающий беззвучно, без голосового управления и наушников, который Капур разрабатывал последние два года — сейчас уже настолько успешно считывает его мысли, что он может заказать такси в Uber, не произнеся ни единого слова.
Читать полностью »

Dialogflower — Google Dialogflow для Яндекс Алисы

2018-06-01 в 7:47, admin, рубрики: diy или сделай сам, алиса, голосовое управление, искусственный интеллект, Программирование, распознавание речи, Яндекс API, яндекс.поиск

Несколько месяцев назад Яндекс запустил бету своего голосового помощника «Алиса», в которой открыл ее API. И вот совсем недавно выкатил все в паблик. Теперь миллионы пользователей могут запускать различные функции и сервисы голосом прямо из мобильного поиска, навигатора и из Яндекс браузера. Неудивительно, что голосовых навыков становится все больше. Но API диалогов предполагает, что вы должны уметь программировать, у вас должен быть свой сервер с HTTPS, и вдобавок вы должны уметь обрабатывать запросы на естественном языке…

Между тем уже давно существует бесплатный и довольно удобный конструктор диалогов от Google под названием Dialogflow. Он конечно же не поддерживает протокол Алисы из коробки, вот и пришла мысль исправить эту ситуацию, чтобы разработчики (и не только) быстро и без серверов создавали навыки для Алисы, которые умеют понимать естественную речь и контекст диалога.
Читать полностью »

ИИ Google научился распознавать голоса людей из беспорядочного хора толпы

2018-04-14 в 7:40, admin, рубрики: Google Research, видео, звук, мозг, распознавание речи

Человек обладает способностью выделять голос собеседника из шума, например, в месте большого скопления людей. Эту способность называют «эффектом коктейльной вечеринки». Наш мозг загружает ненужные звуки. Автоматическое разделение звуков на отдельные дорожки компьютером также изучено, но до сих пор такая работа остаётся сложной задачей для машины.

Команда из Google представила самообучаемую систему, способную «выхватывать» речь человека с помощью одновременного распознавания аудио и видеоряда, отделяя другие голоса и посторонний шум. Исследование называется «Смотреть, чтобы слышать на коктейльной вечеринке» («Looking to Listen at the Cocktail Party»).

Читать полностью »

Распознавание речи на python с помощью pocketsphinx или как я пытался сделать голосового ассистента

2018-03-17 в 19:34, admin, рубрики: cmu sphinx, pocketsphinx, python, python 3, speech_recognition, Работа со звуком, распознавание речи

Это туториал по использованию библиотеки pocketsphinx на Python. Надеюсь он поможет вам
побыстрее разобраться с этой библиотекой и не наступать на мои грабли.

Читать полностью »

Учим машину разбираться в языках

2017-12-15 в 6:29, admin, рубрики: api, cognitive, languages, LUIS, microsoft, translation, Блог компании Microsoft, боты, машинное обучение, обучение бота, Программирование, распознавание речи, чат-бот

Мы уже рассказывали вам несколько раз про нашу интеллектуальную службу распознавания речи — LUIS. И в этих историях всегда была одна проблема: LUIS крутой, но не понимает русский язык. Сегодня всё изменится. Под катом вы узнаете о методе добавления поддержки дополнительных языков в LUIS с помощью службы Translation Cognitive API.

Учим машину разбираться в языках - 1
Читать полностью »

Вышла DuerOS — новая ОС с элементами ИИ

2017-11-22 в 14:14, admin, рубрики: dueros, бизнес-модели, Блог компании ИТ-ГРАД, ИТ-ГРАД, машинное обучение, Программирование, Разработка для интернета вещей, распознавание речи

Компания Baidu в начале ноября выпустила DuerOS — новую операционную систему, которая должна будет подстегнуть разработку систем искусственного интеллекта. По словам разработчиков, ОС позволит быстрее развивать интерактивные возможности ИИ: распознавание и генерацию речи.

Об особенностях DuerOS и функциях операционных систем будущего расскажем далее.

Читать полностью »

Задача распознавания речи пока не решена

2017-11-08 в 10:14, admin, рубрики: искусственный интеллект, машинное обучение, распознавание речи

С тех пор, как на сцену распознавания речи вышло глубинное обучение, количество ошибок в распознавании слов кардинально уменьшилось. Но, несмотря на все те статьи, которые вы могли читать, у нас до сих пор нет распознавания речи человеческого уровня. У распознавателей речи множество причин для отказов. Для прогресса необходимо принять их наличие и предпринять шаги по решению этих проблем. Это единственный способ перейти от распознавания, подходящего для некоторых людей большую часть времени, к распознаванию, работающему для всех людей всё время.

Задача распознавания речи пока не решена - 1

Улучшения в количестве ошибочно распознанных слов. Тестовый голосовой набор был собран на телефонном коммутаторе в 2000 году из 40 случайных разговоров двух человек, чей родной язык – английский

Говорить о том, что мы достигли уровня человека в распознавании речи в разговорах, основываясь лишь на наборе разговоров с телефонного коммутатора, это всё равно, что утверждать, что робомобиль водит не хуже человека, протестировав его в единственном городе в солнечный день без всякого уличного движения. Произошедшие в деле распознавания речи в последнее время сдвиги удивительны. Но заявления по поводу распознавания речи на уровне человека слишком смелы. Вот несколько областей, в которых всё ещё необходимо добиваться улучшений.
Читать полностью »

Почему 500 миллионов человек в Китае разговаривают с этим ИИ

2017-09-17 в 7:54, admin, рубрики: Блог компании Madrobots, будущее здесь, ИИ, искусственный интеллект, распознавание речи

Когда Ганг Сюй, 46-летний житель Пекина, должен связаться со своим канадским арендатором об арендных платежах или счетах за электроэнергию, он открывает приложение под названием iFlytek Input в своём смартфоне и нажимает значок, похожий на микрофон, а затем начинает говорить. Программное обеспечение превращает его китайские слова в текстовые сообщения на английском языке и отправляет их канадскому арендатору. Оно также переводит английские текстовые сообщения арендатора на китайские, позволяя прозрачное общение.
Читать полностью »

Открытые проблемы в области распознавания речи. Лекция в Яндексе

2017-09-10 в 15:57, admin, рубрики: wer, Алгоритмы, Блог компании Яндекс, машинное обучение, нейронные сети, нерешенные задачи, распознавание речи, рекуррентная нейронная сеть, речевые технологии, фреймы

Работа большинства специалистов по речевым технологиям состоит не в том, чтобы придумывать концептуально новые алгоритмы. Компании в основном фокусируются на существующих подходах. Машинный интеллект уже умеет распознавать и синтезировать голос, но не всегда в реальном времени, не всегда локально и не всегда «избирательно» — когда нужно реагировать только на ключевые фразы, робот может ошибаться. Подобными проблемами как раз и заняты разработчики. Муаммар Аль-Шедиват @Laytlas рассказывает об этих и других вопросах, которые пока не удаётся решить даже большим компаниям.

Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «распознавание речи» - 3

Глубокие нейронные сети для автоматической оценки звонков

AlterEgo: девайс, который умеет читать (некоторые) мысли

Dialogflower — Google Dialogflow для Яндекс Алисы

ИИ Google научился распознавать голоса людей из беспорядочного хора толпы

Распознавание речи на python с помощью pocketsphinx или как я пытался сделать голосового ассистента

Учим машину разбираться в языках

Вышла DuerOS — новая ОС с элементами ИИ

Задача распознавания речи пока не решена

Почему 500 миллионов человек в Китае разговаривают с этим ИИ

Открытые проблемы в области распознавания речи. Лекция в Яндексе

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «распознавание речи» - 3

Новости

Актуальные темы

Архив