что такое сигнал в музыке
Цифровое представление аналогового аудиосигнала. Краткий ликбез
Дорогие читатели, меня зовут Феликс Арутюнян. Я студент, профессиональный скрипач. В этой статье хочу поделиться с Вами отрывком из моей презентации, которую я представил в университете музыки и театра Граца по предмету прикладная акустика.
Рассмотрим теоретические аспекты преобразования аналогового (аудио) сигнала в цифровой.
Статья не будет всеохватывающей, но в тексте будут гиперссылки для дальнейшего изучения темы.
Чем отличается цифровой аудиосигнал от аналогового?
Аналоговый (или континуальный) сигнал описывается непрерывной функцией времени, т.е. имеет непрерывную линию с непрерывным множеством возможных значений (рис. 1).
Цифровой сигнал — это сигнал, который можно представить как последовательность определенных цифровых значений. В любой момент времени он может принимать только одно определенное конечное значение (рис. 2).
Аналоговый сигнал в динамическом диапазоне может принимать любые значения. Аналоговый сигнал преобразуется в цифровой с помощью двух процессов — дискретизация и квантование. Очередь процессов не важна.
Дискретизацией называется процесс регистрации (измерения) значения сигнала через определенные промежутки (обычно равные) времени (рис. 3).
Квантование — это процесс разбиения диапазона амплитуды сигнала на определенное количество уровней и округление значений, измеренных во время дискретизации, до ближайшего уровня (рис. 4).
Дискретизация разбивает сигнал по временной составляющей (по вертикали, рис. 5, слева).
Квантование приводит сигнал к заданным значениям, то есть округляет сигнал до ближайших к нему уровней (по горизонтали, рис. 5, справа).
Эти два процесса создают как бы координатную систему, которая позволяет описывать аудиосигнал определенным значением в любой момент времени.
Цифровым называется сигнал, к которому применены дискретизация и квантование. Оцифровка происходит в аналого-цифровом преобразователе (АЦП). Чем больше число уровней квантования и чем выше частота дискретизации, тем точнее цифровой сигнал соответствует аналоговому (рис. 6).
Уровни квантования нумеруются и каждому уровню присваивается двоичный код. (рис. 7)
Количество битов, которые присваиваются каждому уровню квантования называют разрядностью или глубиной квантования (eng. bit depth). Чем выше разрядность, тем больше уровней можно представить двоичным кодом (рис. 8).
Данная формула позволяет вычислить количество уровней квантования:
Если N — количество уровней квантования,
n — разрядность, то
Обычно используют разрядности в 8, 12, 16 и 24 бит. Несложно вычислить, что при n=24 количество уровней N = 16,777,216.
При n = 1 аудиосигнал превратится в азбуку Морзе: либо есть «стук», либо нету. Существует также разрядность 32 бит с плавающей запятой. Обычный компактный Аудио-CD имеет разрядность 16 бит. Чем ниже разрядность, тем больше округляются значения и тем больше ошибка квантования.
Ошибкой квантований называют отклонение квантованного сигнала от аналогового, т.е. разница между входным значением и квантованным значением
(
)
Большие ошибки квантования приводят к сильным искажениям аудиосигнала (шум квантования).
Чем выше разрядность, тем незначительнее ошибки квантования и тем лучше отношение сигнал/шум (Signal-to-noise ratio, SNR), и наоборот: при низкой разрядности вырастает шум (рис. 9).
Разрядность также определяет динамический диапазон сигнала, то есть соотношение максимального и минимального значений. С каждым битом динамический диапазон вырастает примерно на 6dB (Децибел) (6dB это в 2 раза; то есть координатная сетка становиться плотнее, возрастает градация).
Ошибки квантования (округления) из-за недостаточного количество уровней не могут быть исправлены.
50dB SNR
примечание: если аудиофайлы не воспроизводятся онлайн, пожалуйста, скачивайте их.
Теперь о дискретизации.
Как уже говорили ранее, это разбиение сигнала по вертикали и измерение величины значения через определенный промежуток времени. Этот промежуток называется периодом дискретизации или интервалом выборок. Частотой выборок, или частотой дискретизации (всеми известный sample rate) называется величина, обратная периоду дискретизации и измеряется в герцах. Если
T — период дискретизации,
F — частота дискретизации, то
Чтобы аналоговый сигнал можно было преобразовать обратно из цифрового сигнала (точно реконструировать непрерывную и плавную функцию из дискретных, «точечных» значении), нужно следовать теореме Котельникова (теорема Найквиста — Шеннона).
Теорема Котельникова гласит:
Если аналоговый сигнал имеет финитный (ограниченной по ширине) спектр, то он может быть восстановлен однозначно и без потерь по своим дискретным отсчетам, взятым с частотой, строго большей удвоенной верхней частоты.
Вам знакомо число 44.1kHz? Это один из стандартов частоты дискретизации, и это число выбрали именно потому, что человеческое ухо слышит только сигналы до 20kHz. Число 44.1 более чем в два раза больше чем 20, поэтому все частоты в цифровом сигнале, доступные человеческому уху, могут быть преобразованы в аналоговом виде без искажении.
Но ведь 20*2=40, почему 44.1? Все дело в совместимости с стандартами PAL и NTSC. Но сегодня не будем рассматривать этот момент. Что будет, если не следовать теореме Котельникова?
Когда в аудиосигнале встречается частота, которая выше чем 1/2 частоты дискретизации, тогда возникает алиасинг — эффект, приводящий к наложению, неразличимости различных непрерывных сигналов при их дискретизации.
Как видно из предыдущей картинки, точки дискретизации расположены так далеко друг от друга, что при интерполировании (т.е. преобразовании дискретных точек обратно в аналоговый сигнал) по ошибке восстанавливается совершенно другая частота.
Аудиопример 4: Линейно возрастающая частота от
100 до 8000Hz. Частота дискретизации — 16000Hz. Нет алиасинга.
Аудиопример 5: Тот же файл. Частота дискретизации — 8000Hz. Присутствует алиасинг
Пример:
Имеется аудиоматериал, где пиковая частота — 2500Hz. Значит, частоту дискретизации нужно выбрать как минимум 5000Hz.
Следующая характеристика цифрового аудио это битрейт. Битрейт (bitrate) — это объем данных, передаваемых в единицу времени. Битрейт обычно измеряют в битах в секунду (Bit/s или bps). Битрейт может быть переменным, постоянным или усреднённым.
Следующая формула позволяет вычислить битрейт (действительна только для несжатых потоков данных):
Битрейт = Частота дискретизации * Разрядность * Количество каналов
Например, битрейт Audio-CD можно рассчитать так:
44100 (частота дискретизации) * 16 (разрядность) * 2 (количество каналов, stereo)= 1411200 bps = 1411.2 kbit/s
При постоянном битрейте (constant bitrate, CBR) передача объема потока данных в единицу времени не изменяется на протяжении всей передачи. Главное преимущество — возможность довольно точно предсказать размер конечного файла. Из минусов — не оптимальное соотношение размер/качество, так как «плотность» аудиоматериала в течении музыкального произведения динамично изменяется.
При кодировании переменным битрейтом (VBR), кодек выбирает битрейт исходя из задаваемого желаемого качества. Как видно из названия, битрейт варьируется в течение кодируемого аудиофайла. Данный метод даёт наилучшее соотношение качество/размер выходного файла. Из минусов: точный размер конечного файла очень плохо предсказуем.
Усреднённый битрейт (ABR) является частным случаем VBR и занимает промежуточное место между постоянным и переменным битрейтом. Конкретный битрейт задаётся пользователем. Программа все же варьирует его в определенном диапазоне, но не выходит за заданную среднюю величину.
При заданном битрейте качество VBR обычно выше чем ABR. Качество ABR в свою очередь выше чем CBR: VBR > ABR > CBR.
ABR подходит для пользователей, которым нужны преимущества кодирования VBR, но с относительно предсказуемым размером файла. Для ABR обычно требуется кодирование в 2 прохода, так как на первом проходе кодек не знает какие части аудиоматериала должны кодироваться с максимальным битрейтом.
Существуют 3 метода хранения цифрового аудиоматериала:
Несжатый (RAW) формат данных
Другой формат хранения несжатого аудиопотока это WAV. В отличие от RAW, WAV содержит заголовок файла.
Аудиоформаты с сжатием без потерь
Принцип сжатия схож с архиваторами (Winrar, Winzip и т.д.). Данные могут быть сжаты и снова распакованы любое количество раз без потери информации.
Как доказать, что при сжатии без потерь, информация действительно остаётся не тронутой? Это можно доказать методом деструктивной интерференции. Берем две аудиодорожки. В первой дорожке импортируем оригинальный, несжатый wav файл. Во второй дорожке импортируем тот же аудиофайл, сжатый без потерь. Инвертируем фазу одного из дорожек (зеркальное отображение). При проигрывании одновременно обеих дорожек выходной сигнал будет тишиной.
Это доказывает, что оба файла содержат абсолютно идентичные информации (рис. 11).
Кодеки сжатия без потерь: flac, WavPack, Monkey’s Audio…
При сжатии с потерями
акцент делается не на избежание потерь информации, а на спекуляцию с субъективными восприятиями (Психоакустика). Например, ухо взрослого человек обычно не воспринимает частоты выше 16kHz. Используя этот факт, кодек сжатия с потерями может просто жестко срезать все частоты выше 16kHz, так как «все равно никто не услышит разницу».
Другой пример — эффект маскировки. Слабые амплитуды, которые перекрываются сильными амплитудами, могут быть воспроизведены с меньшим качеством. При громких низких частотах тихие средние частоты не улавливаются ухом. Например, если присутствует звук в 1kHz с уровнем громкости в 80dB, то 2kHz-звук с громкостью 40dB больше не слышим.
Этим и пользуется кодек: 2kHz-звук можно убрать.
Кодеки сжатия с потерям: mp3, aac, ogg, wma, Musepack…
Шумы и их применение
Шумы играют важное значение как в саунддизайне, так и при создании различных треков. Рассмотрим какие бывают виды шумов и где они применяются.
Белый шум
Белый шум имеет одинаковую мощность в равных полосах пропускания. Например, полоса пропускания 10 Гц между 20 Гц и 30 Гц содержит такое же количество звуковой мощности, что и полоса пропускания 10 Гц между 10000 Гц и 10 010 Гц.
Для слуховой системы человека белый шум звучит намного ярче, чем можно было бы ожидать от «плоского» спектра. Это потому, что человеческий слух воспринимает частоты в логарифмическом масштабе (октавы), а не в линейном масштабе.
Спектр белого шума
Представленный сигнал (в ссылке) — это сигнал из некоррелированных выборок, таких как числа, генерируемые генератором случайных чисел. Когда возникает такая случайность, сигнал будет содержать все частоты в равной пропорции, и его спектр станет плоским.
Большинство генераторов белого шума используют равномерно распределенные случайные числа, потому что их легко генерировать. Некоторые более дорогие генераторы полагаются на распределение Гаусса, поскольку оно представляет собой лучшее приближение многих реальных случайных процессов. Оба представленных файла будут звучать одинаково, и будут иметь одинаковый плоский спектр. Они будут отличаться только распределением уровней выборки.
Применение белого шума
Розовый шум
Розовый шум — это случайный сигнал, отфильтрованный для получения равной энергии на октаву. Чтобы поддерживать постоянную энергию в октавах, спектральная плотность должна уменьшаться с увеличением частоты (f). Это объясняет, почему розовый шум иногда называют «шум 1 / f». В пересчете на децибелы это уменьшение соответствует 3 дБ на октаву в спектре величин.
Для слуховой системы человека, которая обрабатывает частоты логарифмически, предполагается, что розовый шум звучит одинаково на всех частотах и поэтому наилучшим образом приближается к среднему спектральному распределению музыки.
Спектр розового шума
Однако на практике получается, что наши уши более чувствительны к определенным частотам, например, в диапазоне 2–4 кГц. Розовый шум, несмотря на его равномерное распределение частот в логарифмической шкале частот, будет восприниматься как окрашенный, с заметным пиком, воспринимаемым около 3 кГц. Сглаживание шума воспринимаемым способом создаст серый шум.
Применение розового шума
Коричневый (красный) шум
Коричневый шум — это случайный сигнал, который был отфильтрован, чтобы генерировать большинство энергии на низких частотах. Его плотность мощности обратно пропорциональна f ^ 2 и уменьшается на 6 дБ на октаву. Коричневый шум производит намного более теплый тон, чем белый шум (0 дБ / октава) или розовый шум (-3 дБ / октава).
Каждая октава содержит столько же энергии, сколько две октавы над ней. Например, полоса пропускания 20 Гц между 20 Гц и 40 Гц (одна октава) будет содержать ту же мощность звука, что и полоса пропускания 120 Гц между 40 Гц и 160 Гц (следующие две октавы).
Спектр коричневого (красного) шума
«Коричневое» — это название происходит от «коричневого» движения, а не от цвета. В броуновском движении последующие образцы имеют более высокую вероятность оставаться близко друг к другу, чем далеко уходить. Этот процесс естественным образом отфильтровывает более высокие частоты. Броуновский шум также называют красным шумом. Этот цвет исходит от видимого света, который становится красным, когда применяется аналогичное спектральное распределение.
Применение коричневого (красного) шума
Синий (Лазурный) шум
Синий шум — это случайный сигнал, который был отфильтрован, чтобы генерировать более высокие энергии на более высоких частотах. Его плотность мощности пропорциональна частоте и увеличивается на 3 дБ на октаву. Если присмотреться, то он представляет зеркальное отражение розового шума.
Спектр синего (лазурного) шума
Синий шум содержит много энергии на самых высоких частотах: каждая октава содержит столько же энергии, сколько две октавы под ней!
Синий шум также называют лазурным шумом. Эти названия происходят от видимого света, который превращается в эти цвета, когда применяется аналогичное спектральное распределение.
Применение синего (лазурного) шума
Фиолетовый шум
Известен как дифференцированный белый шум, поскольку он является результатом дифференцирования сигнала белого шума. Фиолетовый шум генерирует очень высокие энергии на более высоких частотах. Его плотность мощности пропорциональна f ^ 2 и увеличивается на 6 дБ на октаву. Если присмотреться, то он представляет зеркальное отражение коричневого (красного) шума.
Фиолетовый шум генерирует много энергии на самых высоких частотах: каждая октава содержит столько же энергии, сколько четыре октавы под ней!
Для нашего слуха он очень яркий и звучит очень резко.
Спектр фиолетового шума
Применение фиолетового шума
Серый шум
Хотя белый шум играет одинаково громко на всех частотах, он не дает слушателю такого ощущения ровности из-за психоакустики. Нужно пропустить белый шум через фильтр, который инвертирует нашу кривую частотной чувствительности, чтобы создать серый шум, шум, который кажется перцептуально плоским.
«Серый шум» — это общий термин. Применяемая кривая «сплющивания» шума зависит от конкретных порогов слышимости слушателя и звукового давления, при котором будет воспроизводиться серый шум. Наши уши чрезвычайно нелинейны, и восприятие различных частот зависит от общей громкости (кривые Флетчера-Мансона ). Например, на более низких уровнях чувствительность наших ушей к более низким и высоким частотам резко падает.
Спектр серого шума
Применение серого шума
Оранжевый шум
Квазистационарный шум с конечной спектральной плотностью, частотные группы которого располагаются на частотах музыкальных нот.
Если говорить более просто, то это шум различных духовых инструментов.
Спектр оранжевого шума
Применение оранжевого шума
Зелёный шум
Это звук, который мы слышим постоянно — повседневный звук «города». Чтобы его создать, за основу берётся розовый или коричневый шум и выделяется область частот в районе 500 Гц и срезом высоких. Для этих целей и применяется в звуковом дизайне.
Спектр зелёного шума
Чёрный шум
У него имеется несколько понятий. Например, это либо отсутствие вообще звука (но не тишина из динамиков, а безмолвная тишина, как в специальных акустических камерах), либо шум с очень низкими и динамически резкими частотами (землетрясения или обрушения здания).
Если рассматривать его с музыкальной точки зрения, то в звукодизайне это спектр шума за гранью слышимой нами области частот. То есть мы его не слышим. Но он способен придавать другим звукам различные оттенки, придавая им новое интересное звучание.
Спектр черного шума
Подписывайтесь на новости New Style Sound и RSS.
За репосты и лайки буду вам очень благодарен.
Похожие записи
Музыка в игорных заведениях: как ее выбирают и какое влияние оказывает на посетителей
5/5 — (11 голосов) Почему в наземных казино чаще играет спокойная музыка… Узнаем, некоторые нюансы о том, что такое музыка…
Русские синтезаторы
4.9/5 — (19 голосов) В России ведется значительное количество разработок и производство синтезаторов, и вот те, русские синтезаторы за которыми…
Аддитивный синтез звука (Additive)
5/5 — (18 голосов) В этой статье поговорим о таком виде, как аддитивный синтез звука (Additive). Подписаться
Субтрактивный синтез звука (Subtractive)
5/5 — (20 голосов) В этой и следующих статьях познакомимся с различными видами синтеза звука. Сегодня поговорим о таком виде,…
Dante, AES 50, AVB и все такое: какой формат аудио сети вам подходит?
5/5 — (30 голосов) Аудиосеть становится все более важной частью концертных и студийных мероприятий. Но в чем разница между всеми сетевыми…
Модуляция звука и её применение
Модуляция — это процесс объединения информационного, в нашем случае звукового сигнала, различной формы. Модуляция звука определенным образом изменяет форму колебаний и бывает нескольких видов. Чаще всего используют амплитудную (AM-amplitude modulation) и частотную модуляцию (FM-frequency modulation).
Давайте разберём эти два вида модуляции звука.
Итоговый звуковой сигнал, в самом простом случае, формируется несущей волной и модулятором, изменяющим эту волну. Для примера будем рассматривать синусоидальные формы звуковой волны и у несущей, и у модулятора.
Амплитудная модуляция (АМ) – модуляция, при которой незатухающие колебания изменяются по амплитуде в соответствии с модулирующими его колебаниями более низкой частоты.
Несущая волна при AM модуляции
Модулирующая волна при AM модуляции
Результат AM модуляции
Как видим звуковой сигнал изменяется по амплитуде с течением времени в соответствии с характеристиками модулятора.
Частотная модуляция (FМ) – модуляция звука, при которой несущая частота сигнала изменяется в соответствии с модулирующим колебанием.
Несущая волна при FM модуляции
Модулирующая волна при FM модуляции
Результат FM модуляции
Видим, что теперь сигнал изменяется не по амплитуде, а по частоте с течением времени и в соответствии с характеристиками модулятора.
Амплитудная модуляция используется в RM синтезе, а
частотная — лежит в основе FM синтеза. Об этих видах синтеза мы поговорим в следующей статье.
Читайте также:
Если понравилась статья, поделись с друзьями!
Добавьте свой комментарий. Отменить ответ
Комментарии: 2
Интересно, что всё это можно прослушать. Понравилась подача.
Рубрики
Подписывайся на новые статьи
Онлайн курс
Электронная музыка
с нуля до PRO
Подробнее
Онлайн курс
Создание EDM в FL Studio
Подробнее
Нашли ошибку?
Выделите текст и нажмите Ctrl+Enter.
Мы используем файлы cookie, чтобы вам было удобнее пользоваться нашим сайтом.
Строго необходимые файлы cookie
Этот веб-сайт использует файлы cookie, чтобы мы могли предоставить вам лучшие результаты вашего запроса. Информация о файлах cookie хранится в вашем браузере и выполняет такие функции, как распознавание вас, когда вы возвращаетесь на наш веб-сайт, и помогает нашей команде понять, какие разделы веб-сайта вы находите наиболее интересными и полезными.
Мы используем файлы cookie, чтобы анализировать трафик, подбирать для вас подходящий контент и рекламу, а также дать вам возможность делиться информацией в социальных сетях. Мы передаем информацию о ваших действиях на сайте партнерам Google: социальным сетям и компаниям, занимающимся рекламой и веб-аналитикой. Наши партнеры могут комбинировать эти сведения с предоставленной вами информацией, а также данными, которые они получили при использовании вами их сервисов.
Строго необходимые файлы cookie должны быть включены постоянно, чтобы мы могли сохранить ваши предпочтения в настройках файлов cookie.
Если вы отключите эти файлы cookie, мы не сможем сохранить ваши настройки. Это означает, что каждый раз, когда вы посещаете этот веб-сайт, вам нужно будет снова включать или отключать файлы cookie.