Что такое "нормализация"?
Нормализация - поиск программой-нормализатором самого громкого фрагмента звукового файла и повышение уровня громкости всего файла на величину разницы этого громкого фрагмента и выставленного при нормализации значения (устанавливается в программе нормализации) или просто до 0 dB.
То есть, если говорить просто, максимум уровня громкости в цифровой технике - 0 дБ. Дальше и громче - просто некуда. В программе-нормализаторе громкость высчитывается и устанавливается пиковый уровень фонограммы (самый громкий пик), скажем, равный -4,68 дБ. То есть громкость можно поднять на 4,68 дБ без появления любых видов искажений, не меняя оригинальную форму волны!!!
Происходит следующее - каждый сэмпл (грубо говоря - точка отсчёта. Если частота сэмплирования 44,1 кГц, таких точек (сэмплов) будет 44 100 в секундном отрезке моно-файла, стерео - х2 канала, то есть в два раза больше) программно увеличивается по громкости ровно на 4,68 дБ. Форма волны абсолютно не искажается, происходит только увеличение общей громкости звукового файла на 4,68 дБ. Если при нормализации программе задать значение "нормализовать до -0,02 дБ", соответственно она поднимет громкость каждого сэмпла на 4,66 дБ и 0,02 дБ - будет запас до цифровой перегрузки. Которая, как известно, является очень неприятным искажением звука и довольно легко различима на слух даже не в самых "тяжёлых случаях".
Для своего эксперимента я выбрал обалденный трек "The Tango Project - Por Una Cabeza.wav", перекодированный с помощью foobar2000 из "The Tango Project - Por Una Cabeza.flac", так как звуковой редактор WaveLab не понимаетlossless форматы, пришлось переконвертировать flac > wav. Ещё я выбрал этот трек, так как он изначально записан тихо и простора для подобного эксперимента хоть отбавляй.
Итак, хочу проделать следующее:
1). Узнать, на сколько самый громкий пик "исходника" тише 0 dB - этого самого "потолка" в цифровой технике.
2). Нормализовать трек.
3). Далее опять понизить уровень на столько же dB.
4). Повернуть фазу редактируемого файла на 180 градусов (противофаза по отношению к оригиналу).
5). Смикшировать треки друг с другом и посмотреть, что же из этого вышло. В идеале должна быть тишина... Динамический диапазон формата 16 bit 44100 Hz - 96 dB. То есть звук с уровнем громкости -96 dB - самый тихий, какой только можно добиться от 16 Bit-ного звукового файла. Этого и попробуем добиться...
6). Весь процесс будет скриншотится в течении всего эксперимента.
Начнём!
Вот наш оригинал. Заметно невооружённым глазом и ухом )), что каналы отличаются по уровню, так записано, такой микс инструментов:
Рис. № 1 - Видно, что простора для эксперимента действительно многовато ))
1). Замеряем пики, чтобы знать, на сколько dB будет громче наш трек после нормализации. Получилось -7.98 dB:
Рис. № 2. Показания уровня пиков оригинала.
2). Происходит нормализация. Трек увеличивается по амплитуде на 7.98 dB. Теперь самый громкий участок достигает 0 dB.
Рис. № 3. Нормализованный трек.
Вот такой результат получен по пикам у нормализованного файла (нормализация до 0 dB), как видно, искажений и перегрузки нет:
Рис. № 4. Уровень пиков нормализованного файла.
3). Теперь, согласно нашему плану, изменяем амплитуду нормализованного трека на -7.98 dB. Не стал делать скриншот. Понятно, картинка будет в точности соответствовать рисунку №1.
4). После поворота фазы на тестируемом треке, снова открываю оригинал, вернее, его точную копию во втором окне. Копирую наш трек и микширую его с этой копией. Прикол в том, что в самом конце появляется артефакт с уровнем -66.23 dB! Совершенно не понятно, откуда ему взяться??? Длина всего в один сэмпл! Какой-то глюк, не иначе... Кстати, скриншот сделан при максимальном разрешении графического представления волны редактора Steinberg WaveLab 6:
Рис. № 5. Артефакт!.
После удаления этого непонятного всплеска, получаем:
Вот что получилось в конце концов, как я и думал! Полная бесконечность, полная цифровая тишина!!! И пусть мне кто-нибудь что-нибудь скажет о пагубном влиянии нормализации на звук!!! Пошлю далеко!
Нормализация - поиск программой-нормализатором самого громкого фрагмента звукового файла и повышение уровня громкости всего файла на величину разницы этого громкого фрагмента и выставленного при нормализации значения (устанавливается в программе нормализации) или просто до 0 dB.
То есть, если говорить просто, максимум уровня громкости в цифровой технике - 0 дБ. Дальше и громче - просто некуда. В программе-нормализаторе громкость высчитывается и устанавливается пиковый уровень фонограммы (самый громкий пик), скажем, равный -4,68 дБ. То есть громкость можно поднять на 4,68 дБ без появления любых видов искажений, не меняя оригинальную форму волны!!!
Происходит следующее - каждый сэмпл (грубо говоря - точка отсчёта. Если частота сэмплирования 44,1 кГц, таких точек (сэмплов) будет 44 100 в секундном отрезке моно-файла, стерео - х2 канала, то есть в два раза больше) программно увеличивается по громкости ровно на 4,68 дБ. Форма волны абсолютно не искажается, происходит только увеличение общей громкости звукового файла на 4,68 дБ. Если при нормализации программе задать значение "нормализовать до -0,02 дБ", соответственно она поднимет громкость каждого сэмпла на 4,66 дБ и 0,02 дБ - будет запас до цифровой перегрузки. Которая, как известно, является очень неприятным искажением звука и довольно легко различима на слух даже не в самых "тяжёлых случаях".
Для своего эксперимента я выбрал обалденный трек "The Tango Project - Por Una Cabeza.wav", перекодированный с помощью foobar2000 из "The Tango Project - Por Una Cabeza.flac", так как звуковой редактор WaveLab не понимаетlossless форматы, пришлось переконвертировать flac > wav. Ещё я выбрал этот трек, так как он изначально записан тихо и простора для подобного эксперимента хоть отбавляй.
Итак, хочу проделать следующее:
1). Узнать, на сколько самый громкий пик "исходника" тише 0 dB - этого самого "потолка" в цифровой технике.
2). Нормализовать трек.
3). Далее опять понизить уровень на столько же dB.
4). Повернуть фазу редактируемого файла на 180 градусов (противофаза по отношению к оригиналу).
5). Смикшировать треки друг с другом и посмотреть, что же из этого вышло. В идеале должна быть тишина... Динамический диапазон формата 16 bit 44100 Hz - 96 dB. То есть звук с уровнем громкости -96 dB - самый тихий, какой только можно добиться от 16 Bit-ного звукового файла. Этого и попробуем добиться...
6). Весь процесс будет скриншотится в течении всего эксперимента.
Начнём!
Вот наш оригинал. Заметно невооружённым глазом и ухом )), что каналы отличаются по уровню, так записано, такой микс инструментов:
Рис. № 1 - Видно, что простора для эксперимента действительно многовато ))
1). Замеряем пики, чтобы знать, на сколько dB будет громче наш трек после нормализации. Получилось -7.98 dB:
Рис. № 2. Показания уровня пиков оригинала.
2). Происходит нормализация. Трек увеличивается по амплитуде на 7.98 dB. Теперь самый громкий участок достигает 0 dB.
Рис. № 3. Нормализованный трек.
Вот такой результат получен по пикам у нормализованного файла (нормализация до 0 dB), как видно, искажений и перегрузки нет:
Рис. № 4. Уровень пиков нормализованного файла.
3). Теперь, согласно нашему плану, изменяем амплитуду нормализованного трека на -7.98 dB. Не стал делать скриншот. Понятно, картинка будет в точности соответствовать рисунку №1.
4). После поворота фазы на тестируемом треке, снова открываю оригинал, вернее, его точную копию во втором окне. Копирую наш трек и микширую его с этой копией. Прикол в том, что в самом конце появляется артефакт с уровнем -66.23 dB! Совершенно не понятно, откуда ему взяться??? Длина всего в один сэмпл! Какой-то глюк, не иначе... Кстати, скриншот сделан при максимальном разрешении графического представления волны редактора Steinberg WaveLab 6:
Рис. № 5. Артефакт!.
После удаления этого непонятного всплеска, получаем:
Вот что получилось в конце концов, как я и думал! Полная бесконечность, полная цифровая тишина!!! И пусть мне кто-нибудь что-нибудь скажет о пагубном влиянии нормализации на звук!!! Пошлю далеко!