Рубрика «Работа со звуком» - 16

Приветствую, уважаемые читатели !
В этой статье хочу рассказать, как я искал музыкальное произведение по его отрывку.
Итак, поехали!
Задача передо мной стоит следующая: есть отрывок музыкального произведения, есть база музыкальных произведений, и необходимо найти, какому из имеющихся музыкальных произведений принадлежит данный отрывок.
Кому интересно, читайте под харбокатом!
Читать полностью »

Влияние технологий на среднюю длину песен

Может быть, кто-то задавался вопросом: почему песни на радио примерно одинаковой длины? Действительно, все они заканчиваются примерно за одно время, нет действительно коротких или слишком длинных песен.

Причина этого феномена не известна. Некоторые специалисты высказывают мнение, что она имеет технологический характер: первые фонографы играли 10-дюймовые диски, которые вращались на скорости 78 RPM и могли вместить около 3 минут музыки.
Читать полностью »

Если честно, то это один из самых сложных «обзоров», что мне доводилось писать. Попросту не знаешь, с чего начать, так как рассказать хочется обо всём и сразу. И эмоции переполняют, и голос рассудка завывает волком, и вообще «полный пэ».

image

SB Roar — это, с одной стороны, очередной представитель «мобильных» аудиоустройств, а с другой — мультимедиа комбайн, который просто, качественно и со вкусом решает проблему «послушать музыку». И с третьей — пожалуй, ROAR — это отличная, пусть и неосознанная, попытка воскресить легендарные для 70-х, 80-х и 90-х годов переносные аудиоцентры.
Читать полностью »

Привет!

После того, как я опубликовал Историю Nintendo и Историю Samsung Electronics я решил продолжить данную традицию. На этот раз выбор пал на компанию Westone, чуть менее известную в России. Зато она известна в США: например, наушники этой компании используются вооруженными силами этой страны. Кроме этого, компания производит звуковое оборудование для медицинских целей — слуховые аппараты и прочее, а также мониторы для музыкантов, наушники для военных и спортсменов.

image

Читать полностью »

Шоу Звук #11 — Подкаст об аудиотехнике, комплектующих, форматах и технологияхС вами «Шоу Звук» — это подкаст для тех, кто любит жить, работать, отдыхать и передвигаться, слушая любимую музыку, подкасты или аудио-книги дома, на работе, в метро или других видах транспорта. Мы говорим простыми словами об аудиотехнике и звуке.

В 11-м выпуске мы с Тимофеем Шиколенковым, директором по маркетингу и развитию бизнеса Аудиомании, обсуждаем специфику и различные мифы из области кабелей и интерфейсов.
Читать полностью »

HD Voice для сотовой связи — Харитон, Дмитрий, Владимир, Олег, Ирина, Слава!

Мы включили HD-Voice на сети «Билайн» в Москве. Ниже записи звука до и после, а также технические детали.

В основе режима HD-voice лежит технология AMR-WB (Adaptive Multi Rate Wadeband) – широкополосное адаптивное кодирование с переменной скоростью), также данный кодек известен как стандарт G.722.22. В теории человек может услышать звуки в диапазоне 20Гц – 20кГц, но на практике достаточно передавать звук в существенно более узком диапазоне. При кодировании речи в AMR-WB используется диапазон частот 50Гц-7кГЦ, этого абсолютно достаточно для полноценной передачи голоса. Для примера, в кодеке AMR используется диапазон 300-3кГц. Метод может использоваться в сетях 2G и 3G.

Проще говоря, теперь человеческий голос будет звучать естественнее, потому что перестанет «ужиматься» в довольно узкую полосу, необходимость которой была когда-то продиктована ограничениями инфраструктуры. Кроме того, при HD-кодировании, внешние шумы оказывают меньшее воздействие на разборчивость речи.Читать полностью »

Все посты серии:
Часть 1. Введение и настройка
Часть 2. Изучение кода
Часть 3. VST и AU
Часть 4. Цифровой дисторшн
Часть 5. Пресеты и GUI
Часть 6. Синтез сигналов
Часть 7. Получение MIDI сообщений
Часть 8. Виртуальная клавиатура
Часть 9. Огибающие
Часть 10. Доработка GUI
Часть 11. Фильтр
Часть 12. Низкочастотный осциллятор


Низкочастотный осциллятор (Low Frequency Oscillator, LFO) — это важная составляющая любого классического синтезатора, и мы добавим ее в свой плагин. Как понятно из названия, это просто осциллятор. Мы используем написанный нами ранее класс Oscillator и зададим ему низкую частоту.
Читать полностью »

Все посты серии:
Часть 1. Введение и настройка
Часть 2. Изучение кода
Часть 3. VST и AU
Часть 4. Цифровой дисторшн
Часть 5. Пресеты и GUI
Часть 6. Синтез сигналов
Часть 7. Получение MIDI сообщений
Часть 8. Виртуальная клавиатура
Часть 9. Огибающие
Часть 10. Доработка GUI
Часть 11. Фильтр


Сегодня мы сделаем резонансный фильтр. Разработка фильтров — это сложная область, над которой ломают голову множество DSP инженеров по всему миру. Мы не будем погружаться в ее дебри, а создадим простой фильтр нижних частот (Low-Pass), полосовой (Band-Pass) и фильтр высоких частот (High-Pass) на основе алгоритма Пола Келлета.

Читать полностью »

Можно смело заявить, что на сегодня CMU Sphinx стал лидером среди свободного софта для распознавания речи. Pocketsphinx поставляется вместе с Ubuntu, многообещающий проект Simon построен с широким его использованием, а структура корпуса Voxforge как бы намекает, что создан он для sphinxtrain.

Несмотря на бурное развитие самого Sphinx'а и методов распознавания речи вообще, каждый, кто пытался использовать его на практике, знает, насколько сложно получить вменяемый результат даже для простых задач. А все потому, что нельзя просто подключить дефолтные модели и ожидать, что система вас поймет. Требуется адаптировать акустику, построить релевантную языковую модель, найти оптимальные параметры и конфигурацию движка — вобщем, потратить недели времени, кропотливо снижая ошибку процент за процентом. Как человек, потративший эти самые недели, могу заверить, что и в этом случае вам ничего не гарантировано. Особенно, если вы хотите распознавать речь, записанную не гарнитурой, а встроенным микрофоном ноутбука, как это часто бывает.
Читать полностью »

Все посты серии:
Часть 1. Введение и настройка
Часть 2. Изучение кода
Часть 3. VST и AU
Часть 4. Цифровой дисторшн
Часть 5. Пресеты и GUI
Часть 6. Синтез сигналов
Часть 7. Получение MIDI сообщений
Часть 8. Виртуальная клавиатура
Часть 9. Огибающие
Часть 10. Доработка GUI


Давайте добавим несколько элементов управления, чтобы можно было менять параметры огибающей и форму волны. Вот результат, который мы хотим получить (отсюда можно скачать слоеный TIFF):

Создание аудиоплагинов, часть 10
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js