Искусственный интеллект давно перестал быть набором скучных алгоритмов. Это и художник, который рисует словами, и переводчик, что ломает языковые барьеры, и музыкант, играющий на голосовых нотах. Но есть у него ещё одно дело, в котором он преуспел, — синтез речи.
Рубрика «голос»
Синтез речи ◍ 2025: топ-4 бесплатных нейросетей для озвучки текста
2025-05-27 в 13:11, admin, рубрики: APIHost, ElevenLabs, Robivox, Voicemaker, голос, нейросети, озвучка текста, омографы, речь, синтез речиСексуальная окраска голоса ИИ
2025-01-22 в 8:48, admin, рубрики: голос, искусственный интеллект, сексуальность, ЭмоцииИгорь Ашманов еще десять лет назад сказал, что в результате маркетинговых исследований первых роботов-пылесосов пионеры домашней робототехники буду сфокусированы на эмоциональном взаимодействии между домашним роботом и хозяином.
В его примере робот-пылесос формировал эмоциональную привязанность у молодых бабушек. В 50 лет у женщины происходит перестройка организма, и появляется потребность заботиться о внуке – маленьком беспомощном существе. И эту потребность частично закрывает робот-пылесос.
Google запустил сервис, где нейросеть оценивает вокал пользователя и сравнивает с Фредди Меркьюри
2019-11-15 в 8:30, admin, рубрики: Google Creative Lab, Google Research, queen, YouTube, будущее здесь, голос, звук, ИИ, искусственный интеллект, Научно-популярное, нейросеть, Фредди Меркьюри
Google открыл в общий доступ для всех пользователей экспериментальный онлайн-сервис с использованием искусственного интеллекта — FreddieMeter.
Этот интересный проект создан компанией Google совместно с YouTube, в разработке приняли участие подразделения Google Creative Lab и Google Research в сотрудничестве с группой Queen и студиями звукозаписи Universal Music Group и Hollywood Records. На недавно запущенном онлайн-портале, созданном Google, предлагается всем пользователям сравнить свои вокальные данные с голосом легендарного Фредди Меркьюри.
Читать полностью »
Вы еще не договорили слово “привет”, а мы уже знаем, кто вы
2018-09-07 в 15:21, admin, рубрики: facenet, features processing, speaker verification, speech processing, triplet loss, Алгоритмы, Блог компании Neurodata Lab, голос, звук, машинное обучение, Научно-популярное, сверточные нейронные сети, спектрограммаЭто может делать наша нейросеть, распознающая человека по одному произнесенному слогу. Однако тема этой статьи не касается напрямую идентификации по голосу, хотя и будет связана с ней. Мы расскажем о нейросетевых фичах, так называемых d-vector, которые можно использовать в задачах обработки звука: от верификации до распознавания речи и эмоций.

От аукционов до колыбельных: как и где «работает» человеческий голос
2018-06-30 в 8:37, admin, рубрики: Аудиомания, Блог компании Аудиомания, голос, звук, Работа со звуком, речьВыразительность человеческого голоса уникальна. Он позволяет людям обмениваться информацией, воздействует на наши эмоции, может служить источником напряжения или расслабления и быть «музыкальным инструментом». Сегодня рассказываем о том, как голос используется в различных ситуациях и влияет на наше настроение и действия.
Кстати, если вам больше нравится микроформат — у нас есть свой Telegram-канал.
Сервис Google Duplex пугает своей красивой и правильной речью, есть недовольные
2018-05-13 в 19:31, admin, рубрики: Duplex, будущее здесь, голос, инфобез, искусственный интеллект, роботы и человек, сервисы
Несколько дней назад корпорация Google представила сразу несколько новинок, которые взбудоражили как представителей телекоммуникационной сферы, так и обычных людей. Одна из них — сервис Google Duplex, это слабая форма ИИ, способная позвонить вместо своего пользователя в парикмахерскую и записать человека на определенное время.
Duplex можно считать своего рода цифровым ассистентом человека, причем гораздо более «человечным» чем те же Siri или Cortana. Обычные разговоры ассистент вести не может, работа его касается лишь назначения времени встречи или приема. Но «речь» виртуального помощника звучит очень реалистично. Вряд ли кто-либо из нас смог бы отличить ее от речи обычного человека. И как раз эта схожесть напугала некоторых специалистов по информационной безопасности.
Читать полностью »
Алиса, Google Assistant, Siri, Alexa. Как писать приложения для голосовых ассистентов
2018-04-07 в 6:20, admin, рубрики: Actions on Google, alexa, amazon, apple, Google API, google assistant, JS, siri, алиса, Блог компании Touch Instinct, голос, голосовые, голосовые ассистенты, голосовые приложения, диалоги, Исследования и прогнозы в IT, разработка мобильных приложений, Яндекс API, яндекс алиса, яндекс диалоги
Рынок голосовых ассистентов расширяется, особенно для русскоязычных пользователей. 2 недели назад Яндекс рассказала впервые про платформу Яндекс.Диалоги, 2 месяца назад Google представила возможность писать диалоги для Google Assistant на русском языке, 2 года назад со сцены Bill Graham Civic Auditorium Apple выпустила в открытое плавание SiriKit. Фактически, появляется новая отрасль разработки, где должны быть свои проектировщики, архитекторы и разработчики. Идеальный момент, чтобы поговорить про голосовые помощники и api для них.
В этой статье не будет подробных туториалов. Это статья об идеях и интересных технических деталях, на которых построены инструменты для сторонних разработчиков основных игроков рынка: Apple Siri, Google Assistant и Алисы от Яндекса.
Читать полностью »
Аутентификация и идентификация по голосу с помощью когнитивных сервисов Microsoft
2017-03-15 в 6:10, admin, рубрики: azure, cognitive services, Microsoft Azure, oxford, project, recognition, uwp, voice, говорящего, голос, голоса, идентификация, разработка мобильных приложений, разработка под windows, разработка под windows phone, распознование
Когнитивные сервисы представляют доступ к различным облачным сервисам, которые позволяют работать с визуальной, голосовой и текстовой информацией. Кроме того, доступны различные поисковые функции Bing.
Для того, чтобы попробовать когнитивные сервисы в действии даже не обязательно иметь аккаунт Microsoft. Получить пробный ключ можно и с помощью аккаунта GitHub или LinkedIn. Пробная подписка не ограничена по времени, но ограничена по количеству используемых ресурсов за период. Ознакомиться с онлайн демонстрацией можно по адресу: Speaker Recognition API
Далее идет описание того как опробовать в действии аутентификацию пользователя с помощью голоса. Хоть сервис еще и в состоянии preview, но, несмотря на это, уже довольно интересен.
Сервис может быть использован из различных платформ, но я буду рассматривать создание C#/XAML приложения UWP.
Читать полностью »
Русский колл-центр: екатеринбуржский Наумен + SIP-шлюз сборки Новосибирска, результаты
2016-02-16 в 6:46, admin, рубрики: Eltex, sip, voip, Блог компании КРОК, голос, импортозамещение, инфраструктура, ит-инфраструктура, колл-центр, сделано в СССР, Стандарты связи, телефония, шлюз 
Шлюз отечественного производства (разработка, отладка, поверхностный монтаж)
Привет!
Мы тут протестировали совместную работу контакт-центра отечественного вендора Naumen и голосового транкового шлюза SMG-2 российской компании Eltex. Эти две штуки вместе дают полноценный отечественный колл-центр.
Отличается это решение от других тем, что оно подходит под понятие «импортозамещение». Я, когда слышу это слово, уже дёргаюсь: на рынке сейчас многие просто переклеивают наклейку и пишут документацию на русском. Но тут всё прямо как надо.Читать полностью »


