Взгляд на звук через спектрограмму

в 13:01, , рубрики: Audacity, ruvds_статьи, звук, спектрограмма
Я хочу познакомить вас со взглядом на звук как на спектр и побудить на самостоятельные акустические эксперименты. Вам не потребуется никаких денежных затрат, так как все опыты будем проводить в бесплатной программе Audacity. Представление звука в виде спектрограммы может найти множество применений, например, для диагностики работы механизмов, в анализе тембров инструментов, сэмплов, синтезаторов. Статья рассчитана на новичков.

Взгляд на звук через спектрограмму - 1

Спектрограмма звука скрипки. Автор: Omegatron.

Моё увлечение акустикой началось с проекта, когда я хотел сделать анимацию северного сияния, которая бы реагировала на музыку. Я использовал фрагмент классического произведения Баха. Открыл его в программе Audacity в режиме отображения спектрограммы, и внимание сразу привлекли волнообразные штрихи. Так на спектре выглядит исполнительский приём вибрато, смысл которого в переменном изменении тона при игре на музыкальном инструменте.

Взгляд на звук через спектрограмму - 2

Спектрограмма — это двумерное графическое отображение спектра сигнала, изменяющегося во времени. Рассмотрим, как выглядит сигнал с основной частотой в 1000 Гц, который содержит добавочные спектральные компоненты.

Взгляд на звук через спектрограмму - 3

Вертикальная ось спектрограммы — это ось частоты, горизонтальная — времени. Спектральная мощность выражается в виде яркости и цвета. Серый цвет (фон) — это отсутствие сигнала, голубой — слабый сигнал, фуксия и белый — сильный сигнал. Мы видим ряд ярких горизонтальных полос. Самая нижняя находится на отметке в 1000 Гц, далее идут полосы на частотах 2000 Гц, 4000 Гц и выше. Это так называемые гармоники, известные музыкантам как обертоны.

▍ Создаём гармонический сигнал

Чтобы сгенерировать сигнал самостоятельно и посмотреть его спектр, сделайте следующее. Вначале запустите Audacity, выберите в верхнем меню «Tracks» → «Add New» → «Mono Track». Затем кликните по пункту меню «Generate» — там будут разные варианты, выберите «Tone», и в открывшемся окошке введите значения частоты, продолжительности и амплитуды. Рекомендую сгенерировать синусоидальный сигнал с амплитудой 0.6, продолжительностью 10–20 секунд и частотой в 1 килогерц.

Взгляд на звук через спектрограмму - 4

Внутри выделенного трека появится сгенерированный сигнал.

Чтобы переключить режим отображения спектрограммы, нажмите на выпадающий список с названием трека и переключите режим, как показано на скриншоте.

Взгляд на звук через спектрограмму - 5

Вы увидите примерно такую же картину (ширину треков можно произвольно изменять).

▍ Настройки отображения спектрограммы

Существует фундаментальная математическая причина, называемая оконным преобразованием Фурье, которое можно сравнить с математическим «окном», анализирующим небольшой участок аудиосигнала и разбивающим его на частотные компоненты.

Взгляд на звук через спектрограмму - 6

Настройка «Window Size» влияет на детализацию спектрограммы. Меньшее количество сэмплов улучшает временное разрешение — вы видите более точную картину изменений сигнала по времени. Напротив, большее количество сэмплов повышает частотное разрешение, позволяя детальнее рассматривать спектральный состав.

Взгляд на звук через спектрограмму - 7

Усиление «Gain (dB)» позволяет сделать слабые сигналы ярче. Динамический диапазон «Range (dB)» позволяет указать охват между самыми тихими и самыми громкими частями сигнала. Узкий охват делает спектрограмму контрастнее. Усиление влияет на общий уровень яркости.

Чёрно-белый режим спектрограммы упрощает восприятие, где интенсивность оттенков серого показывает амплитуду частотных составляющих. В моей версии программы белый цвет означает тишину, а чёрный — сигнал.

О влиянии настройки масштаба «Scale» я расскажу чуть позже.

▍ График спектра

Выделите небольшой, секунда-две, участок трека с сигналом. Затем в меню «Analyze» выберите «Plot Spectrum». Откроется окно, содержащее график АЧХ (амплитудно-частотной характеристики) усреднённого спектра выделенного фрагмента.

Взгляд на звук через спектрограмму - 8

В самом начале знакомства нам важны две настройки: «Size» — этот пункт аналогичен настройке, отвечающей за размер окна, которое было упомянуто выше. Чем выше значение, тем большее разрешение АЧХ. И «Axis», которая отвечает за выбор линейного либо логарифмического масштаба оси частоты. Ниже вы поймёте, для чего они нужны.

Взгляд на звук через спектрограмму - 9

График АЧХ можно представить как участок спектрограммы, который мы вырезали в виде узкой области, повернули и смотрим на него с торца. И наоборот, спектрограмму можно представить в виде пакета отдельных АЧХ, стоящих друг за другом и показывающих динамику фонограммы во времени.

Обратите внимание, что значения спектра можно экспортировать в текстовый файл для анализа в математических программах.

Также есть полезная функция — при перемещении курсора показывается значение частоты пика в герцах и его ближайший музыкальный тон (на скриншоте это Си второй октавы или B5). Это может пригодиться для настройки инструментов или для реверс-инжиниринга мелодии.

▍ Логарифмический и линейный масштабы

Взгляните на скриншот: это спектрограмма звукоряда равномерно темперированного строя от До контроктавы до конца пятой октавы. Вот так он выглядит в линейном масштабе. Я включил на синтезаторе простой генератор синусоидальной волны, чтобы не было гармоник. Представьте, что вы нажимаете последовательно клавиши длинного-длинного рояля от самой левой до правой, не пропуская ни одну.

Взгляд на звук через спектрограмму - 10

Обратите внимание, что интервал в один полутон в области баса имеет очень малое приращение в абсолютном значении частоты. Вторая нота Ре отличается от предшествующей ноты До на четыре герца. Примерно в середине звукоряда во второй октаве Ре отличается от До на 64 герца. В конце, в пятой октаве, разница между этими нотами почти полкилогерца! При этом для нашего слуха переходы через половину тона по всему звукоряду кажутся равномерными.

Отгадка в нашей природной особенности ощущения звуковысотности: она логарифмическая. И если включить логарифмический масштаб для отображения, ступени звукоряда выстроятся почти в прямую линию.

Взгляд на звук через спектрограмму - 11

Становится заметно, что в области басов разрешение значительно ниже, чем в области высоких частот. Это происходит как раз по причине логарифмического масштаба оси частоты.

▍ Интересная находка

Однажды я открыл в Audacity звук с видео, на котором были записаны голоса сорок (птиц), и в одном из каналов взгляд зацепился за странные «шашечки», едва заметные глазу. Обратите внимание на область 17 000 Гц.

Взгляд на звук через спектрограмму - 12

Увеличенный фрагмент, смотрите на самый верхний край спектрограммы, видно едва.

Мне показалось это очень странным и необычным. При помощи эквалайзера я отсёк всё, что лежало ниже 17 килогерц, и понизил в несколько десятков раз высоту звука при помощи инструмента «Change Pitch», чтобы можно было этот звук услышать в области единиц килогерц. И меня поразил результат: это было очень похоже на трели сверчка! Оказывается, у нас водятся некие насекомые, издающие трели в высокочастотной (и уже недоступной для моих ушей) части спектра.

▍ Как выглядят спектры разных звуков

Много о частотном составе звука можно узнать, взглянув на спектрограмму. Я выбрал в фонде Викимедиа различные примеры звуковых записей, на каждый из которых будет ссылка. Вы можете сначала посмотреть на спектрограмму.

Колокольчики. Видно, что звук занимает высокочастотный диапазон и состоит из множества коротких быстрозатухающих всплесков.

Взгляд на звук через спектрограмму - 13

Звук больших колоколов (как и других упругих металлических предметов) имеет несколько характерных особенностей. Во-первых, видны стабильные полосы — частоты собственных механических резонансов системы. Во-вторых, отчётливо видно, что высокочастотные компоненты колебаний затухают быстрее низкочастотных. В-третьих, заметно, что сила колебаний гармоник как бы ритмически пульсирует — этот эффект почему-то нравится нам и на слух воспринимается как глубокий и бархатистый, богатый звук, как у этого плоского колокола.

Взгляд на звук через спектрограмму - 14

Спектрограмма звука большого колокола собора спасения нации, из Бухареста. Видна аналогичная картина. Отчётливо видны моменты ударов по колоколу.

Взгляд на звук через спектрограмму - 15

Звук центробежного звукового извещателя (сирены). Видно, как с набором оборотов ротора повышается частота основного тона и гармоник, видны режимы установившихся оборотов и выбега.

Взгляд на звук через спектрограмму - 16

Звук диафона — звукового извещателя, выполненного по принципу большого гудка. Заметно, что в самом начале работы имеется момент резкого щелчка, дающего всплеск по всему диапазону частот. Затем идёт период нестабильности, и частота какое-то время колеблется, а затем стабилизируется. Осторожно, громкий и резкий не совсем приятный звук!

Взгляд на звук через спектрограмму - 17

Голос человека. Я специально выбрал нейтральный образец — пение молодой девушки на языке индейцев. Голоса живых существ всегда отличаются на спектрограммах наличием модуляции частоты (волны и изгибы) и наличием множества обертонов.

Взгляд на звук через спектрограмму - 18

Мяукание кошки. Визуально похоже на человеческую речь, но есть одна особенность. Обратите внимание, что наиболее яркие участки в спектре находятся не на частоте основного колебания, а в области 2–3 кГц. Это можно объяснить резонансными особенностями анатомии животного, подчёркивающими средние, наиболее яркие части спектра.

Взгляд на звук через спектрограмму - 19

Самые необычные спектральные картины дают записи птичьих песен. Пожалуй, только спектрограмма даёт понимание, насколько птицы виртуозно могут манипулировать со звуком: изменять его частоту, интенсивность и спектральный состав, причём делая это с большой скоростью.

Взгляд на звук через спектрограмму - 20

Надеюсь, мой рассказ кого-то побудит заняться звукозаписью и исследованием мира звуков. Я призываю вас не откладывать дело до лучших времён и начать с тем уровнем оснащения, который у вас имеется, а именно с экспериментов по записи звуков на смартфон. Попробуйте записать различные звуки: голоса людей, животных, пение домашних птиц, звуки работы механизмов, звуки, издаваемые разными бытовыми предметами. Запишите и посмотрите, как выглядит их спектр!

© 2025 ООО «МТ ФИНАНС»

Автор: engine9

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js