Голосовые интерфейсы в наши дни вездесущи. Во-первых — всё больше пользователей мобильных телефонов используют голосовых помощников, таких как Siri и Cortana. Во-вторых — устройства, вроде Amazon Echo и Google Home, становятся привычным элементом интерьера. Эти системы построены на базе программного обеспечения для распознавания речи, которое позволяет пользователям общаться с машинами с помощью голосовых команд. Теперь же эстафета, в обличье Web Speech API, переходит к браузерам.
Рубрика «распознавание речи» - 4
Будущее веб-технологий: создаём интеллектуального чат-бота, который может слышать и говорить
2017-08-22 в 10:15, admin, рубрики: javascript, node.js, Блог компании RUVDS.com, искусственный интеллект, разработка, распознавание речи, синтезатор речи, чат-ботЧем грозит преждевременная автоматизация
2017-06-28 в 12:29, admin, рубрики: speech-to-text, text-to-speech, автоматизация, Блог компании UIS, виртуальная АТС, обработка звонков, распознавание речи, сценарии использования, телефония, Управление продажами, управление проектами
Оды автоматизации на основе технологий перевода речи в текст и обратно не утихают. Кто только не хвалится тем, как оптимизировал бизнес и сократил издержки. Да взять хотя бы нас самих: не только автоматизируем собственные процессы, а еще и другим помогаем. Но важно понимать, что автоматизация не только полезна, но и вредна. Под катом пара примеров второго вида (без имен, разумеется) плюс чек-лист, с помощью которого удастся не превратить первое во второе.
Учим робота слушать разговоры
2017-05-25 в 10:19, admin, рубрики: speech-to-text, Блог компании UIS, виртуальная АТС, запись разговоров, контроль качества, машинное обучение, обработка звонков, Разработка систем связи, распознавание речи, Семантика, сценарии использования, телефония
В ручном режиме контролировать все коммуникации — задача трудоемкая и, кроме того, малоэффективная. И мы решили ее автоматизировать. Для этого пришлось обучить нашу Виртуальную АТС новым трюкам. Технологию Text-to-speech мы внедрили давно, теперь же взялись за обратный процесс.
Google AIY: мейкерский набор для создания гаджетов с голосовым управлением
2017-05-06 в 11:38, admin, рубрики: AIY, DIY, diy или сделай сам, Voice Kit, гаджеты, голосовое управление, Интернет вещей, искусственный интеллект, распознавание речи, робототехника
Компания Google запустила инициативу AIY Projects, чтобы совместить AI с DYI, то есть совместить программные приложения ИИ с наборами для сборки гаджетов. В результате, считает Google, мейкеры смогут изготовлять полезные устройства, которые помогут «решать реальные проблемы» в жизни. Эти гаджеты будут по-настоящему взаимодействовать с человеком. Например, распознавать речь, отвечать на вопросы и выполнять голосовые команды.
Первым проектом стал Voice Kit — демонстрационная система распознавания речи с подключением к Google Assistant (или без подключения). Как сказано в описании, в дополнении ко всем обычным функциям Google Assistant, тут вы сможете ещё добавлять в гаджет собственные пары вопросов и ответов. Приборчик выполнен в виде маленького картонного кубика с Rasberry Pi 3 внутри. Сборка набора из 12 деталей займёт примерно 1,5 часа.
Читать полностью »
Новый рекорд в распознавании речи: уровень ошибок алгоритма снижен до 5,5%
2017-03-28 в 22:50, admin, рубрики: IBM, Блог компании IBM, высокая производительность, машинное обучение, облачные сервисы, распознавание речи
IBM 100: Истоки работы над распознаванием речи
Обычный человек, в среднем, пропускает мимо внимания или неправильно распознает 1-2 слова из 20, произнесенных собеседником. В ходе пятиминутной беседы количество не расслышанных или неправильно распознанных человеком слов может достичь 80. Довольно много, правда? А что по поводу компьютеров — какой процент ошибок у них?
В прошлом году корпорация IBM заявила о новом рекорде в разработке технологий распознавания речи. Количество ошибок, допущенных сервисом, снизилось до 6,9%. С тех пор компания многое улучшила, что в 2017 году позволило добиться нового рекорда в 5,5%.
Читать полностью »
Распознавание речи с аппаратным ускорением. Специализированный ASIC потребляет менее 8 мВт
2017-02-14 в 11:21, admin, рубрики: asic, CSAIL, Qmulus, Quanta Computer, Интернет вещей, искусственный интеллект, МТИ, Носимая электроника, Производство и разработка электроники, распознавание речи, Энергия и элементы питания
Технические характеристики специализированной микросхемы ASIC для распознавания речи
Голосовые команды — самый естественный и удобный интерфейс для управления электроникой. Можно представить, что в будущем понимать команды хозяина будут практически все электронные приборы: от лампочек в квартире до холодильника, микроволновой печи и чайника на кухне. Соединённые в общую сеть Интернета вещей эти приборы будут не только понимать хозяина, но и согласовывать свои действия друг с другом.
В последние годы технологии распознавания речи достигли высокого уровня и созрели для различных коммерческих приложений: управление автомобильным компьютером, здравоохранение (ведение документации в цифровом виде по распознаванию речи врачей) и применение в армии. Например, в итальянском учебно-тренировочном самолёте M-346 и в американском истребителе-бомбардировщике F-35 точность систем распознавания речи достигает 98%. Но чтобы выполнять распознавание речи на бытовых приборах и носимой электронике, нужно кардинально снизить энергопотребление этого интерфейса.
Читать полностью »
Простейшее управление компьютером при помощи голоса
2017-01-16 в 4:07, admin, рубрики: accessibility, mfcc, MLP, мел-кепстральные коэффициенты, нейронные сети, парализованный, Работа со звуком, распознавание речи, шейник, метки: парализованный, шейник"
Если вас интересует, как помочь обездвиженному человеку управлять компьютером для общения с внешним миром – вам сюда. Если вам интересно, какое отношение к этому имеют мел-частотные кепстральные коэффициенты и нейронные сети – вам тоже сюда.
Читать полностью »
Сравнение Google Home и Amazon Alexa
2017-01-13 в 9:04, admin, рубрики: amazon, Google, IoT, голосовое управление, распознавание речи, умный домНедавно мне в руки попало два популярных голосовых помощника. В этом обзоре я расскажу о том, что они умеют и чего пока не умеют.
Полиция хочет допросить Алексу из колонки Amazon Echo по делу об убийстве
2016-12-27 в 21:50, admin, рубрики: amazon echo, IoT, Алекса, аудиозапись, будущее здесь, Интернет вещей, информационная безопасность, искусственный интеллект, Киберпанк, распознавание речи, расследование, убийство, улики, метки: Алекса
Умный динамик Amazon Echo — 24-сантиметровая цилиндрическая колонка с микрофонной решёткой. Прибор устанавливается в квартире, управляется голосом и реагирует на женское имя Алекса (сайт вашей Алексы открывается по личному паролю). Очень полезная вещь: после произнесения своего имени она записывает речь пользователя, распознаёт её (в облаке), хранит записи разговоров (их можно удалить через приложение), может выполнять команды — читать книги, играть музыку, устанавливать будильник. Или просто разговаривать с хозяином. Во втором сезоне хакерского сериала Mr. Robot такая колонка была единственной подругой спецагента киберподразделения ФБР Доминик ДиПьеро, так что вы знаете, о чём речь.
Об уникальных способностях Алексы узнала и американская полиция, которая теперь вымогает у корпорации Amazon запись разговоров в квартире, где произошло убийство.
Читать полностью »
Нейросеть читает по губам 46,8% слов по телевизору, человек — только 12,4%
2016-11-21 в 14:00, admin, рубрики: Google, звук, искусственный интеллект, нейросеть, распознавание речи, чтение по губам
Кадры четырёх передач, по которым обучалась программа, а также слово "afternoon", произнесённое двумя разными дикторами
Две недели назад рассказывалось о нейросети LipNet, которая показала рекордное качество 93,4% распознавания человеческой речи по губам. Уже тогда предполагалось множество применений для такого рода компьютерных систем: медицинские слуховые аппараты нового поколения с распознаванием речи, системы для беззвучных лекций в публичных местах, биометрическая идентификация, системы скрытой передачи информации для шпионажа, распознавание речи по видеоряду с камер наблюдения и т.д. И вот сейчас специалисты из Оксфордского университета совместно с сотрудником Google DeepMind поведали о собственных разработках в этой области.
Читать полностью »