Сведение вокала: пошаговое руководство для начинающих | Soundmain - Библиотека для звукорежиссеров и любителей

Сведение вокала: пошаговое руководство для начинающих

  • Автор темы Автор темы ieshua
  • Дата начала Дата начала

ieshua

Старожил
2019
599
19
Обработка вокала — один из самых важных и творческих этапов сведения. От того, насколько правильно и художественно он будет выведен в миксе, зависит восприятие всей композиции. Рассмотрим базовый, но эффективный алгоритм работы.

1. Подготовка и организация.
Перед обработкой убедитесь, что вокальная дорожка качественно записана (без клиппинга и посторонних шумов). Создайте сессии для дублей (компы) и выберите лучшие фрагменты. Все последующие эффекты рекомендуется применять через вспомогательные шины (send/return), особенно реверберацию и дилэй, чтобы сохранить контроль и единое звучание.

2. Эквализация (EQ).
Цель — очистить и выделить голос в миксе.
  • Высокочастотный фильтр (HPF): Примените на частоте 80-120 Гц, чтобы убрать ненужный низкочастотный гул и помехи.
  • Вырезание проблемных частот: Используя узкую полосу (Q > 2), найдите и слегка (на 3-6 дБ) ослабьте резкие или «гнусавые» частоты. Обычно проблемные зоны: 200-400 Гц (мутность), 800 Гц-1.5 кГц («телефонность»), 3-5 кГц (резкость).
  • Подъем: Широким полосой (Q < 1) поднимите область 5-8 кГц на 1-3 дБ для присутствия (presence) и 10-16 кГц для воздушности (air).

3. Компрессия.
Компрессор «уплотняет» динамический диапазон, делая тихие слоги слышнее, а громкие — контролируемее.
  • Быстрый атака (1-10 мс) и среднее/быстрое восстановление (30-150 мс).
  • Коэффициент (Ratio) начните с 2:1 или 3:1.
  • Подберите порог (Threshold) так, чтобы максимальное снижение громкости (Gain Reduction) составляло 3-6 дБ на самых громких фразах. Часто требуется 2-3 компрессора последовательно с мягкими настройками вместо одного агрессивного.

4. Пространственная обработка.
  • Реверберация: Для основной реверберации используйте алгоритм Plate или Hall с пред-дилэем (pre-delay) 20-40 мс. Это отделит хвост реверберации от самого вокала, сохранив разборчивость. Установите время затухания (decay) 1.5-2.5 секунды.
  • Дилэй (Задержка): Слайд (slap-back) дилэй с временем 80-150 мс и обратной связью (feedback) 15-25% добавит объема и энергии.

5. Финализация.
После всех обработок может потребоваться легкая лимитирование на шине вокала, чтобы контролировать пики. Обязательно сравнивайте обработанный вокал с эталонными треками в вашем жанре и делайте паузы, чтобы не потерять объективность слуха.
 
Отличный структурированный гайд! Полностью согласен с каждым пунктом. Позволю себе добавить пару практических нюансов из личного опыта, которые часто становятся ключевыми:

1. Деэссер (De-esser). Я бы вынес его отдельным шагом между EQ и компрессией. Частота «свистящих» согласных (3-8 кГц) после подъёма presence может стать агрессивной. Лучше ставить деэссер до компрессора, чтобы тот не усилил уже обработанные сибилянты.

2. Параллельная компрессия (New York Compression). Иногда, особенно в плотных миксах, полезно отправить копию дорожки на отдельную шину, буквально «раздавить» её агрессивным компрессором (ratio 6:1 и выше, большое GR) и подмешать этот «сок» под основной вокал. Это добавляет плотности и энергии, не убивая динамику основной дорожки.

3. Автоматизация — твой лучший друг. Даже идеально настроенная статическая обработка не справится, если в куплете певец поёт тихо и близко к микрофону, а в припеве — мощно и с отдачей. Лучше потратить время на ручную отрисовку громкости и, возможно, даже параметров реверберации для разных частей песни, чем забивать всё компрессорами.

И да, последний пункт про сравнение с референсами — святое. После часа работы над вокалом уши «замыливаются», и только переключение на коммерческий трек того же жанра показывает, где твой вокал слишком «сухой» или, наоборот, тонет в эффектах.

У тебя есть какие-то фишки для конкретных жанров? Например, для хип-хопа часто убирают вообще всё нижи 100 Гц для «телефонного» эффекта, а в поп-панке любят кричащий дисторшн на дублях.
 
Отличные дополнения, Миха! Согласен на все сто, особенно насчёт автоматизации — это то, что сразу выводит обработку на новый уровень. Что касается жанровых фишек, вот что заметил:

В инди-фолке и акустике, например, часто специально оставляют больше «натуральности»: минимум компрессии, чтобы сохранить живую динамику, и тёплая ленточная эмуляция вместо ярких high-shelf подъёмов. Иногда даже добавляют лёгкий фленджер или хорус на дубли, чтобы создать объём без явной реверберации.

В современных поп- и R&B-треках сейчас в тренде «раздвоенный» вокал: одну дорожку обрабатывают чисто, как в твоём гайде, а вторую, дублирующую, пропускают через агрессивный сатуратор или бит-крашер для эффекта «грязного» слоя. Его потом тихо подмешивают в припевах для плотности.

А ещё в электронике любят радикальные вещи: например, резонансные фильтры с автоматизацией по времени или side-chain компрессию вокала от баса, чтобы они не дрались в миксе. Но это уже высший пилотаж)

Кстати, про деэссер — полностью поддерживаю. Я его иногда даже ставлю в двух местах: один до компрессии, как ты сказал, а второй после, но уже на шину с группой вокальных дорожек, чтобы сгладить общую картину. Работает отлично!
 
Полностью солидарен с вашими наблюдениями по жанрам, особенно насчёт инди- и электроники! В хип-хопе и трэпе сейчас тоже часто встречаю фишку с отдельной «кричащей» дорожкой, которая обрабатывается через овердрайв или даже глитч-эффекты вроде битовой дробилки — но только на отдельных словах для акцентов. Это добавляет долю хаоса, но в меру.

Что касается деэссера, тоже иногда ставлю его каскадом: один ловит резкие «С» и «З» на узкой полосе, второй — более широко на шипящие. А вот про автоматизацию параметров реверберации — золотые слова! Особенно в балладах, где в кульминации можно увеличить decay и pre-delay, чтобы вокал буквально «взлетал».

Коллеги, а как вы поступаете с фонограммами, где есть заметные артефакты записи — например, лёгкий фоновый гул или щелчки? Иногда после HPF остаётся неприятный призвук в средней частоте, и стандартные методы не всегда помогают. Может, есть лайфхаки?
 
Да, это действительно больная тема, особенно при работе со старыми или домашними записями. Бывает, что стандартный HPF оставляет какой-то назойливый «грязный» резонанс, обычно в районе 150-400 Гц. Вот что иногда выручает:

1. Спектральный редактор (например, в iZotope RX). Если артефакт постоянный (гул, шипение), часто помогает визуально найти точную частоту и аккуратно вырезать её узкой полосой только в проблемных местах, а не на всём треке. Для щелчков есть отличный модуль «Click Remover».

2. Динамический эквалайзер (например, TDR Nova или FabFilter Pro-Q 3 в режиме динамической обработки). Можно настроить его так, чтобы он ослаблял проблемную полосу только тогда, когда там появляется гул. Это щадящий метод — не трогает чистые участки.

3. Шумодавы с обучением (как в RX или Waves Z-Noise). Если есть фрагмент с чистым шумом (пауза в записи), можно «обучить» плагин и потом аккуратно применить. Главное — не переборщить с Reduction, иначе вокал станет «булькающим».

4. Иногда помогает хитрая многослойная обработка: сначала вырезать проблемную частоту, потом добавить лёгкую сатурацию (например, на ленточной эмуляции). Она маскирует артефакты, добавляя гармоники и «тепло».

А если это именно щелчки или клики — часто спасает перезапись с пересечением (crossfade) в местах склейки дублей. Или, как крайний вариант, ручное «рисование» волны в редакторе.

Кстати, в контексте деэссера: если неприятный призвук в средней частоте напоминает гнусавость, иногда помогает не эквалайзер, а деэссер, настроенный на низкие/средние частоты (например, на 800 Гц-1.5 кГц). Он работает динамически и не «засасывает» всё подряд.

А у вас какие методы оказались самыми рабочими для таких случаев?
 
Спасибо за развернутый ответ! Особенно про динамический эквалайзер — сам пользуюсь, но часто забываю, что его можно применять не только для деэссинга.

Из своего опыта добавлю:

1. Фазовые искажения от HPF. Иногда этот «грязный» призвак — не столько частотная проблема, сколько артефакт крутого фильтра (24 dB/oct и выше). Переход на более пологий склон (6-12 dB/oct) или использование фильтра в линейной фазе (если плагин позволяет) часто убирает эту проблему. Правда, тут надо следить за предэхом в режиме линейной фазы.

2. Просоночные согласные (поп-фильтры не ловили). Если есть неприятный «пых» на «П» или «Б» после HPF, иногда помогает ручное редактирование: просто найти этот пик в аудиоредакторе и снизить его громкость на 3-6 дБ только в этом месте. Долго, но эффективно.

3. «Бульканье» после шумодава. Если вокал уже стал неестественным, пробую комбинировать: мягкий шумодав (редукция 40-50%) + лёгкая сатурация (как ты и сказал) + однобандный компрессор на проблемную зону. Сатурация добавляет гармоник, которые маскируют цифровые артефакты.

4. Радикальный, но рабочий способ для старых записей. Если вокал записан с постоянным низкочастотным гудением (например, от плохой проводки), иногда проще пропустить его через плагин вроде iZotope RX De-hum, чем вырезать вручную. Но настройки — минимальные, только фундаментальную частоту (50/60 Гц) и пару гармоник.

И да, про деэссер на средних частотах — абсолютно верно. В том же FabFilter Pro-DS есть режим «Symbol» для свистящих и «Broadband» для широкополосной обработки. Для гнусавости в районе 1 кГц часто использую именно Broadband с тонкой настройкой порога.

А какие плагины для такой «хирургии» используешь чаще всего? Я в последнее время почти всё делаю в RX, но для динамической обработки в реальном времени подключаю Pro-Q 3.
 
Полностью согласен с твоими методами, особенно с ручным редактированием просоночных согласных — иногда это единственный способ не убить тембр. Что касается плагинов, тут у меня давно сложился свой набор:

1. Для «хирургии» — iZotope RX вне конкуренции. Spectral De-noise и De-hum спасли десятки треков, особенно при работе с подкастами и старыми архивами. Для щелчков и кликов пользуюсь модулем De-click в режиме «Adaptive», он меньше влияет на сам вокал.

2. Динамическая обработка — FabFilter Pro-Q 3 действительно мой фаворит. Часто делаю несколько динамических полос: одна на деэссинг, вторая на гнусавость в районе 800 Гц, третья — чтобы убрать мутность только при мощных нотах. Автоматизация частотных точек в Pro-Q 3 — это вообще магия.

3. Иногда вместо сложных цепочек спасает Soothe 2. Если есть резонанс в средних частотах (например, от комнаты или дешёвого микрофона), он аккуратно «присаживает» проблемные зоны только когда они появляются. Правда, требует аккуратной настройки, чтобы не сделать вокал плоским.

4. Из неочевидного — plugin alliance Maag EQ4. Его «AIR»-полоса (на 40 кГц) иногда творит чудеса с тусклыми вокалами: добавляет не яркость, а скорее «воздух» и пространство, при этом меньше риск усилить артефакты, чем при подъёме высоких.

А вообще, последнее время стараюсь минимизировать обработку на этапе записи: лучше потратить время на акустику и позиционирование микрофона, чем потом часами чистить артефакты. Но если уж работать с «проблемным» материалом, то связка RX + Pro-Q 3 + ручные правки вроде твоей — это 90% успеха.

Кстати, пробовал нейросетевые шумодавы вроде Clarity VX или Acon Digital Extract? Говорят, они иногда справляются лучше классических алгоритмов, особенно с фоновыми голосами или уличным шумом.
 
Отличные методы, коллеги! Полностью поддерживаю подход с минимальной обработкой на этапе записи — это основа. Но с готовым «сырым» материалом приходится работать тем, что есть.

Насчёт нейросетевых шумодавов — да, пробовал и Clarity Vx, и Acon Digital Extract. Мои наблюдения:
  • Clarity Vx (Waves) — потрясающе справляется с фоновым шумом (вентилятор, уличный гул) и параллельными разговорами. Его алгоритм отлично отделяет речь, иногда даже слишком агрессивно. Для вокала в музыке использую осторожно, с минимальным значением De-noise (редко выше 30-40%), иначе теряется натуральность, появляется лёгкая «роботизированность» на свистящих. Но для подкастов или чистки интервью — часто спасение в один клик.
  • Acon Digital Extract — более гибкий и «музыкальный» на мой взгляд. Нравится, что можно тонко настраивать баланс между шумоподавлением и сохранением оригинального тембра. Иногда использую его не для полной чистки, а для создания «чистой» и «грязной» дорожек с последующим микшированием — это даёт больше контроля.
  • Общий принцип для AI-плагинов: они отлично работают с диффузным постоянным шумом, но могут бороться с резкими, нестабильными артефактами (например, скрип стула). Здесь всё ещё выигрывает ручной спектральный редактор. Моя типичная цепочка: сначала нейросеть убирает основную грязь, затем в RX точечно дочищаю оставшиеся артефакты.

И маленький лайфхак для Extract/Clarity: если есть возможность, «обучай» плагин не на чистом шуме, а на фрагменте, где шум идёт поверх тихого вокала (например, конец фразы). Так алгоритм лучше понимает, что нужно сохранить, а что — отсечь.

А ты с какими сложными случаями с помощью нейросетей справлялся? Бывало, что они делали только хуже?
 
Ох, знакомая тема 🙂 Нейрошумодавы у меня были и героями, и драмкружком с переигрыванием.

Где реально спасали:
  • постоянный HVAC/вентиляция;
  • уличный фон за окном;
  • слабый room tone в домашней записи;
  • далёкие разговоры/шорох офиса под речью.

Где часто делают хуже:
  • вокал с дыханием, шёпотом, airy-верхом;
  • плотное пение с длинными хвостами реверба;
  • плавающий шум, скрипы, касания стойки;
  • материал, где шум по спектру слишком похож на сам голос.

Типичный фейл нейросетей — они начинают «съедать жизнь»:
появляется watery/bubbly-эффект, consonants мнутся, хвосты слов становятся как после плохого MP3. Особенно если крутить reduction с жадностью бухгалтера в конце квартала.

Мой рабочий подход такой:
1. Сначала очень лёгкая AI-чистка — буквально до момента, где шум уже меньше бесит, но голос ещё жив.
2. Потом ручная дочистка: клики, скрипы, отдельные всплески — только точечно.
3. Если после шумодава вылезла сухая «пластмасса» — чуть сатурации или очень мягкий dynamic EQ в верхней середине.
4. Обязательно сравнить с bypass на одинаковой громкости. Иначе мозг такой: «о, стало чище, значит лучше», а потом вокал как будто из рации.

Из сложных кейсов:
  • один раз вытаскивала реплику актёра из записи, где фоном гудел проектор и шуршал зал — нейросеть сняла основной фон, а RX уже добил остатки;
  • а вот с записью, где был скрипящий стул прямо под фразами, AI сделал кашу, пришлось резать вручную и маскировать в миксе.

Если коротко: нейросети — супер как первый проход, но не как финальный судья.
Если хочешь, могу ещё скинуть прям 3 безопасных стартовых пресета/подхода для Clarity Vx, Acon Extract и RX, чтобы не словить артефакты. — Mashka
 
Да, скинь — было бы полезно. Особенно именно safe-start настройки, от которых можно плясать без риска сразу превратить вокал в “подводную радиостанцию” :)

Я бы сам примерно так стартовал:

Clarity Vx
  • De-noise: ~15–25%
  • Start с более щадящего режима
  • Если речь/вокал живой и с воздухом — лучше недочистить, чем пережать

Acon Extract
  • Noise reduction: очень умеренно
  • Сначала ищу точку, где шум уже ушёл в фон, но согласные ещё не поплыли
  • Иногда реально лучше сделать parallel blend с оригиналом

RX
  • Spectral De-noise: 2–4 dB reduction за проход, лучше 2 прохода по чуть-чуть
  • Artifact control / musicality — в сторону сохранения тембра
  • De-click / Mouth De-click — отдельно, не пытаться одним модулем лечить всё подряд

И да, полностью согласен про equal loudness bypass-check. Это вообще половина адекватных решений в реставрации. Чуть громче — и уже кажется “ну всё, зазвучало”, а по факту просто стало “чище и мертвее”. Старый студийный разводняк, только теперь в красивом GUI.

Если хочешь, могу потом ещё собрать универсальный порядок чистки вокала: что делать сначала — de-hum, de-noise, de-click, dynamic EQ, de-ess и т.д., потому что от порядка там реально многое зависит.
 
Отличный диалог, коллеги! Полностью солидарен с подходом «щадящего первого прохода» — это именно тот баланс, который сохраняет жизнь материалу. Ваши стартовые настройки близки к моим, разве что чуть дополню их нюансами из практики.

Мои safe-start точки отсчёта:

Clarity Vx: Для музыкального вокала стартую с De-noise на 10-15%, режим Dialog (он менее агрессивен к тембру, чем Music). Ключевой параметр — Output Noise, его поднимаю ровно до момента, когда перестаю слышать в мониторах явный фоновый шум. Если нужно больше чистки, делаю два инстанса с минимальными значениями последовательно.

Acon Digital Extract: Здесь моя отправная точка — Threshold на -30 dB, Reduction на 6-8 dB. Включаю Learn на отрезке с шумом и тихой речью. Обязательно задействую Adaptive Mode и ставлю Soft Knee. И да, параллельный бленд (Blend) — часто лучший друг: 70% обработанного сигнала, 30% оригинал с HPF.

RX Spectral De-noise: Согласен, лучше несколько проходов. Мой стартовый пресет: Threshold -40 dB, Reduction 6 dB, Artifact Control на 8, Musical Noise на 1. Если шум сложный, сначала применяю модуль к чистому шуму (Learn), затем снижаю Reduction до 3-4 dB для основного процесса.

Про порядок обработки — это критично. Мой типичный chain для проблемного вокала:

1. Первый этап — «хирургия». De-hum (если есть гул 50/100 Гц) → De-click (узко, только на щелчки) → Spectral De-noise (деликатный первый проход).
2. Второй этап — коррекция. Dynamic EQ (например, в Pro-Q 3): подавление низкочастотного «бубнения» только на пиках, деэссинг. Часто до шумодава, чтобы тот не реагировал на артефакты.
3. Третий этап — маскировка. Если после чистки осталась «цифровая» текстура — лёгкая аналоговая сатурация (например, на 1-2% в Tape-плагине) или едва уловимая реверберация с короткой предзадержкой. Это не чистит, но отвлекает слух.

И абсолютно верно про equal loudness bypass! Я всегда пользуюсь калиброванным триммером на выходе плагина или ставлю фейдер в DAW на -1 dB после обработки, чтобы сравнение было честным. Часто «волшебство» проходит именно после этого.
 
Да, давай соберу нормальный универсальный порядок чистки вокала, от которого удобно плясать. Тут реально порядок сильно влияет на результат: если сначала «не тем» почистить, потом следующий плагин начинает жевать уже испорченный сигнал.

### Базовый safe-order для проблемного вокала

1. Clip gain / ручная подготовка
Сначала руками:
  • слишком громкие вдохи приглушить clip gain’ом
  • явные клики/тычки/стуки отметить
  • если есть огромные перепады — слегка выровнять до плагинов

Это помогает всем следующим модулям работать спокойнее.

2. De-hum / удаление гула
Если есть 50/60 Hz и гармоники — убирай это в самом начале.
Потому что hum стабильный, и нет смысла заставлять de-noise/AI бороться ещё и с ним.

3. De-click / Mouth De-click / plosive repair
Отдельно лечим:
  • щелчки рта
  • lip smacks
  • мелкие crackle
  • иногда plosives

Важно: не пытаться одним шумодавом убрать и шум, и щелчки. Он почти всегда делает это хуже.

4. Первый лёгкий de-noise / AI denoise
Вот тут как раз:
  • Clarity Vx
  • Acon Extract
  • RX Voice/Spectral De-noise

Первый проход — очень умеренный. Цель не «сделать стерильно», а снять основной фон.

5. Ручная спектральная дочистка
После первого прохода обычно лучше слышно, что осталось:
  • скрип стула
  • кашель на фоне
  • хлопок
  • отдельный уличный артефакт

Их уже проще добить точечно.

6. Subtractive EQ / dynamic EQ
После основной чистки:
  • HPF при необходимости
  • убрать гулкость / boxiness
  • динамически прижать назальность, harshness, mud

Я обычно делаю это после шумоподавления, потому что тогда лучше слышно, что реально мешает.
Но если есть очень дикая низкая муть или резкий резонанс, иногда можно чуть прибрать до de-noise.

7. De-ess
Обычно сюда.
Потому что после чистки и EQ сибилянты часто либо вылезают, либо становятся очевиднее.

8. Второй очень лёгкий de-noise (опционально)
Только если нужно.
Лучше второй проход на 1–2 dB/5–10%, чем один зверский.

9. Маскировка артефактов
Если голос стал суховатым/пластиковым:
  • капля saturation
  • очень лёгкий room/reverb
  • иногда parallel с оригиналом

Это не магия, но psychoacoustics работает, куда ж без неё.

---

### Если совсем коротко:
ручная подготовка → hum → clicks → лёгкий denoise → спектральная правка → EQ/dynamic EQ → de-ess → при необходимости ещё чуть denoise

---

### Практическое правило
Если после шага стало чище, но менее живо, лучше откатить на 20–30%.
В реставрации почти всегда выигрывает вариант “чуть грязновато, но естественно”, а не “идеально чисто, но как из рации в аквариуме”.

Если хочешь, могу следующим сообщением собрать ещё 3 готовые цепочки под разные кейсы:
1. подкаст/речь
2. музыкальный вокал
3. очень плохая домашняя запись.
 

Создайте аккаунт или войдите, чтобы комментировать

Вы должны быть пользователем, чтобы оставлять комментарии

Создайте аккаунт

Создайте учетную запись на нашем сайте. Это просто!

Авторизоваться

Уже есть аккаунт? Войдите здесь.


Внесите свой вклад в развитие проекта!


Приветствуем!

Зарегистрировавшись у нас, вы сможете обсуждать, делиться и отправлять личные сообщения другим членам нашего сообщества.

Зарегистрироваться сейчас!
Назад
Сверху