Приветствую, уважаемые читатели !
В этой статье хочу рассказать, как я искал музыкальное произведение по его отрывку.
Итак, поехали!
Задача передо мной стоит следующая: есть отрывок музыкального произведения, есть база музыкальных произведений, и необходимо найти, какому из имеющихся музыкальных произведений принадлежит данный отрывок.
Кому интересно, читайте под харбокатом!
Читать полностью »
Рубрика «Работа со звуком» - 16
Ищем мелодию по фрагменту
2014-07-15 в 11:54, admin, рубрики: data mining, datamining, информационный поиск, Работа со звукомВлияние технологий на среднюю длину песен
2014-07-13 в 13:00, admin, рубрики: data mining, музыка, продолжительность песни, Работа со звуком, Статистика в IT
Может быть, кто-то задавался вопросом: почему песни на радио примерно одинаковой длины? Действительно, все они заканчиваются примерно за одно время, нет действительно коротких или слишком длинных песен.
Причина этого феномена не известна. Некоторые специалисты высказывают мнение, что она имеет технологический характер: первые фонографы играли 10-дюймовые диски, которые вращались на скорости 78 RPM и могли вместить около 3 минут музыки.
Читать полностью »
Sound Blaster ROAR: Boombox XXI века
2014-07-10 в 11:00, admin, рубрики: bluetooth, creative, roar, sb roar, sr20, sr20 roar, usb powerbank, аудиосистема, Беспроводные технологии, бумбокс, всё равно никто не читает теги, Гаджеты. Устройства для гиков, геттобластер, звук, колонка, много тегов не бывает, музыка, музыка с мобильника, музыка с собой, переносная колонка, Работа со звукомЕсли честно, то это один из самых сложных «обзоров», что мне доводилось писать. Попросту не знаешь, с чего начать, так как рассказать хочется обо всём и сразу. И эмоции переполняют, и голос рассудка завывает волком, и вообще «полный пэ».
SB Roar — это, с одной стороны, очередной представитель «мобильных» аудиоустройств, а с другой — мультимедиа комбайн, который просто, качественно и со вкусом решает проблему «послушать музыку». И с третьей — пожалуй, ROAR — это отличная, пусть и неосознанная, попытка воскресить легендарные для 70-х, 80-х и 90-х годов переносные аудиоцентры.
Читать полностью »
История компании Westone
2014-07-04 в 5:52, admin, рубрики: Weston, Дизайн в IT, звук, история, История ИТ, наушники, Работа со звукомПривет!
После того, как я опубликовал Историю Nintendo и Историю Samsung Electronics я решил продолжить данную традицию. На этот раз выбор пал на компанию Westone, чуть менее известную в России. Зато она известна в США: например, наушники этой компании используются вооруженными силами этой страны. Кроме этого, компания производит звуковое оборудование для медицинских целей — слуховые аппараты и прочее, а также мониторы для музыкантов, наушники для военных и спортсменов.
Шоу Звук #11 — Подкаст об аудиотехнике, комплектующих, форматах и технологиях
2014-07-03 в 11:39, admin, рубрики: Блог компании Аудиомания, Работа со звуком, цифровой звукС вами «Шоу Звук» — это подкаст для тех, кто любит жить, работать, отдыхать и передвигаться, слушая любимую музыку, подкасты или аудио-книги дома, на работе, в метро или других видах транспорта. Мы говорим простыми словами об аудиотехнике и звуке.
В 11-м выпуске мы с Тимофеем Шиколенковым, директором по маркетингу и развитию бизнеса Аудиомании, обсуждаем специфику и различные мифы из области кабелей и интерфейсов.
Читать полностью »
HD-Voice для сотовой связи — Харитон, Дмитрий, Владимир, Олег, Ирина, Слава!
2014-07-01 в 7:51, admin, рубрики: Блог компании ВымпелКом (Билайн), вымпелком, Работа со звуком, сотовая связь, телефония, метки: вымпелком, сотовая связь, телефония
Мы включили HD-Voice на сети «Билайн» в Москве. Ниже записи звука до и после, а также технические детали.
В основе режима HD-voice лежит технология AMR-WB (Adaptive Multi Rate Wadeband) – широкополосное адаптивное кодирование с переменной скоростью), также данный кодек известен как стандарт G.722.22. В теории человек может услышать звуки в диапазоне 20Гц – 20кГц, но на практике достаточно передавать звук в существенно более узком диапазоне. При кодировании речи в AMR-WB используется диапазон частот 50Гц-7кГЦ, этого абсолютно достаточно для полноценной передачи голоса. Для примера, в кодеке AMR используется диапазон 300-3кГц. Метод может использоваться в сетях 2G и 3G.
Проще говоря, теперь человеческий голос будет звучать естественнее, потому что перестанет «ужиматься» в довольно узкую полосу, необходимость которой была когда-то продиктована ограничениями инфраструктуры. Кроме того, при HD-кодировании, внешние шумы оказывают меньшее воздействие на разборчивость речи.Читать полностью »
Создание аудиоплагинов, часть 12
2014-06-27 в 6:19, admin, рубрики: c++, dsp, Martin Finke, Oli Larkin, Reaper, Visual Studio, VST, xcode, перевод, Работа со звуком, метки: c++, dsp, Martin Finke, Oli Larkin, Reaper, Visual Studio, VST, xcode, АУ, перевод Все посты серии:
Часть 1. Введение и настройка
Часть 2. Изучение кода
Часть 3. VST и AU
Часть 4. Цифровой дисторшн
Часть 5. Пресеты и GUI
Часть 6. Синтез сигналов
Часть 7. Получение MIDI сообщений
Часть 8. Виртуальная клавиатура
Часть 9. Огибающие
Часть 10. Доработка GUI
Часть 11. Фильтр
Часть 12. Низкочастотный осциллятор
Низкочастотный осциллятор (Low Frequency Oscillator, LFO) — это важная составляющая любого классического синтезатора, и мы добавим ее в свой плагин. Как понятно из названия, это просто осциллятор. Мы используем написанный нами ранее класс Oscillator
и зададим ему низкую частоту.
Читать полностью »
Создание аудиоплагинов, часть 11
2014-06-26 в 17:30, admin, рубрики: c++, dsp, Martin Finke, Oli Larkin, Reaper, Visual Studio, VST, xcode, перевод, Работа со звуком, метки: c++, dsp, Martin Finke, Oli Larkin, Reaper, Visual Studio, VST, xcode, АУ, перевод Все посты серии:
Часть 1. Введение и настройка
Часть 2. Изучение кода
Часть 3. VST и AU
Часть 4. Цифровой дисторшн
Часть 5. Пресеты и GUI
Часть 6. Синтез сигналов
Часть 7. Получение MIDI сообщений
Часть 8. Виртуальная клавиатура
Часть 9. Огибающие
Часть 10. Доработка GUI
Часть 11. Фильтр
Сегодня мы сделаем резонансный фильтр. Разработка фильтров — это сложная область, над которой ломают голову множество DSP инженеров по всему миру. Мы не будем погружаться в ее дебри, а создадим простой фильтр нижних частот (Low-Pass), полосовой (Band-Pass) и фильтр высоких частот (High-Pass) на основе алгоритма Пола Келлета.
Шумопонижение в CMU Sphinx
2014-06-25 в 16:43, admin, рубрики: speech recognition, Работа со звуком, распознавание речи, Софт, шумоподавление, метки: speech recognition, распознавание речи, шумоподавлениеМожно смело заявить, что на сегодня CMU Sphinx стал лидером среди свободного софта для распознавания речи. Pocketsphinx поставляется вместе с Ubuntu, многообещающий проект Simon построен с широким его использованием, а структура корпуса Voxforge как бы намекает, что создан он для sphinxtrain.
Несмотря на бурное развитие самого Sphinx'а и методов распознавания речи вообще, каждый, кто пытался использовать его на практике, знает, насколько сложно получить вменяемый результат даже для простых задач. А все потому, что нельзя просто подключить дефолтные модели и ожидать, что система вас поймет. Требуется адаптировать акустику, построить релевантную языковую модель, найти оптимальные параметры и конфигурацию движка — вобщем, потратить недели времени, кропотливо снижая ошибку процент за процентом. Как человек, потративший эти самые недели, могу заверить, что и в этом случае вам ничего не гарантировано. Особенно, если вы хотите распознавать речь, записанную не гарнитурой, а встроенным микрофоном ноутбука, как это часто бывает.
Читать полностью »
Создание аудиоплагинов, часть 10
2014-06-25 в 14:14, admin, рубрики: c++, dsp, Martin Finke, Oli Larkin, Reaper, Visual Studio, VST, xcode, интерфейсы, перевод, Работа со звуком, метки: c++, dsp, Martin Finke, Oli Larkin, Reaper, Visual Studio, VST, xcode, АУ, перевод Все посты серии:
Часть 1. Введение и настройка
Часть 2. Изучение кода
Часть 3. VST и AU
Часть 4. Цифровой дисторшн
Часть 5. Пресеты и GUI
Часть 6. Синтез сигналов
Часть 7. Получение MIDI сообщений
Часть 8. Виртуальная клавиатура
Часть 9. Огибающие
Часть 10. Доработка GUI
Давайте добавим несколько элементов управления, чтобы можно было менять параметры огибающей и форму волны. Вот результат, который мы хотим получить (отсюда можно скачать слоеный TIFF):