Сведение вокала: пошаговое руководство для начинающих | Soundmain - Библиотека для звукорежиссеров и любителей

Сведение вокала: пошаговое руководство для начинающих

  • Автор темы Автор темы ieshua
  • Дата начала Дата начала

ieshua

Старожил
2019
599
19
Обработка вокала — один из самых важных и творческих этапов сведения. От того, насколько правильно и художественно он будет выведен в миксе, зависит восприятие всей композиции. Рассмотрим базовый, но эффективный алгоритм работы.

1. Подготовка и организация.
Перед обработкой убедитесь, что вокальная дорожка качественно записана (без клиппинга и посторонних шумов). Создайте сессии для дублей (компы) и выберите лучшие фрагменты. Все последующие эффекты рекомендуется применять через вспомогательные шины (send/return), особенно реверберацию и дилэй, чтобы сохранить контроль и единое звучание.

2. Эквализация (EQ).
Цель — очистить и выделить голос в миксе.
  • Высокочастотный фильтр (HPF): Примените на частоте 80-120 Гц, чтобы убрать ненужный низкочастотный гул и помехи.
  • Вырезание проблемных частот: Используя узкую полосу (Q > 2), найдите и слегка (на 3-6 дБ) ослабьте резкие или «гнусавые» частоты. Обычно проблемные зоны: 200-400 Гц (мутность), 800 Гц-1.5 кГц («телефонность»), 3-5 кГц (резкость).
  • Подъем: Широким полосой (Q < 1) поднимите область 5-8 кГц на 1-3 дБ для присутствия (presence) и 10-16 кГц для воздушности (air).

3. Компрессия.
Компрессор «уплотняет» динамический диапазон, делая тихие слоги слышнее, а громкие — контролируемее.
  • Быстрый атака (1-10 мс) и среднее/быстрое восстановление (30-150 мс).
  • Коэффициент (Ratio) начните с 2:1 или 3:1.
  • Подберите порог (Threshold) так, чтобы максимальное снижение громкости (Gain Reduction) составляло 3-6 дБ на самых громких фразах. Часто требуется 2-3 компрессора последовательно с мягкими настройками вместо одного агрессивного.

4. Пространственная обработка.
  • Реверберация: Для основной реверберации используйте алгоритм Plate или Hall с пред-дилэем (pre-delay) 20-40 мс. Это отделит хвост реверберации от самого вокала, сохранив разборчивость. Установите время затухания (decay) 1.5-2.5 секунды.
  • Дилэй (Задержка): Слайд (slap-back) дилэй с временем 80-150 мс и обратной связью (feedback) 15-25% добавит объема и энергии.

5. Финализация.
После всех обработок может потребоваться легкая лимитирование на шине вокала, чтобы контролировать пики. Обязательно сравнивайте обработанный вокал с эталонными треками в вашем жанре и делайте паузы, чтобы не потерять объективность слуха.
 
Отличный структурированный гайд! Полностью согласен с каждым пунктом. Позволю себе добавить пару практических нюансов из личного опыта, которые часто становятся ключевыми:

1. Деэссер (De-esser). Я бы вынес его отдельным шагом между EQ и компрессией. Частота «свистящих» согласных (3-8 кГц) после подъёма presence может стать агрессивной. Лучше ставить деэссер до компрессора, чтобы тот не усилил уже обработанные сибилянты.

2. Параллельная компрессия (New York Compression). Иногда, особенно в плотных миксах, полезно отправить копию дорожки на отдельную шину, буквально «раздавить» её агрессивным компрессором (ratio 6:1 и выше, большое GR) и подмешать этот «сок» под основной вокал. Это добавляет плотности и энергии, не убивая динамику основной дорожки.

3. Автоматизация — твой лучший друг. Даже идеально настроенная статическая обработка не справится, если в куплете певец поёт тихо и близко к микрофону, а в припеве — мощно и с отдачей. Лучше потратить время на ручную отрисовку громкости и, возможно, даже параметров реверберации для разных частей песни, чем забивать всё компрессорами.

И да, последний пункт про сравнение с референсами — святое. После часа работы над вокалом уши «замыливаются», и только переключение на коммерческий трек того же жанра показывает, где твой вокал слишком «сухой» или, наоборот, тонет в эффектах.

У тебя есть какие-то фишки для конкретных жанров? Например, для хип-хопа часто убирают вообще всё нижи 100 Гц для «телефонного» эффекта, а в поп-панке любят кричащий дисторшн на дублях.
 
Отличные дополнения, Миха! Согласен на все сто, особенно насчёт автоматизации — это то, что сразу выводит обработку на новый уровень. Что касается жанровых фишек, вот что заметил:

В инди-фолке и акустике, например, часто специально оставляют больше «натуральности»: минимум компрессии, чтобы сохранить живую динамику, и тёплая ленточная эмуляция вместо ярких high-shelf подъёмов. Иногда даже добавляют лёгкий фленджер или хорус на дубли, чтобы создать объём без явной реверберации.

В современных поп- и R&B-треках сейчас в тренде «раздвоенный» вокал: одну дорожку обрабатывают чисто, как в твоём гайде, а вторую, дублирующую, пропускают через агрессивный сатуратор или бит-крашер для эффекта «грязного» слоя. Его потом тихо подмешивают в припевах для плотности.

А ещё в электронике любят радикальные вещи: например, резонансные фильтры с автоматизацией по времени или side-chain компрессию вокала от баса, чтобы они не дрались в миксе. Но это уже высший пилотаж)

Кстати, про деэссер — полностью поддерживаю. Я его иногда даже ставлю в двух местах: один до компрессии, как ты сказал, а второй после, но уже на шину с группой вокальных дорожек, чтобы сгладить общую картину. Работает отлично!
 
Полностью солидарен с вашими наблюдениями по жанрам, особенно насчёт инди- и электроники! В хип-хопе и трэпе сейчас тоже часто встречаю фишку с отдельной «кричащей» дорожкой, которая обрабатывается через овердрайв или даже глитч-эффекты вроде битовой дробилки — но только на отдельных словах для акцентов. Это добавляет долю хаоса, но в меру.

Что касается деэссера, тоже иногда ставлю его каскадом: один ловит резкие «С» и «З» на узкой полосе, второй — более широко на шипящие. А вот про автоматизацию параметров реверберации — золотые слова! Особенно в балладах, где в кульминации можно увеличить decay и pre-delay, чтобы вокал буквально «взлетал».

Коллеги, а как вы поступаете с фонограммами, где есть заметные артефакты записи — например, лёгкий фоновый гул или щелчки? Иногда после HPF остаётся неприятный призвук в средней частоте, и стандартные методы не всегда помогают. Может, есть лайфхаки?
 
Да, это действительно больная тема, особенно при работе со старыми или домашними записями. Бывает, что стандартный HPF оставляет какой-то назойливый «грязный» резонанс, обычно в районе 150-400 Гц. Вот что иногда выручает:

1. Спектральный редактор (например, в iZotope RX). Если артефакт постоянный (гул, шипение), часто помогает визуально найти точную частоту и аккуратно вырезать её узкой полосой только в проблемных местах, а не на всём треке. Для щелчков есть отличный модуль «Click Remover».

2. Динамический эквалайзер (например, TDR Nova или FabFilter Pro-Q 3 в режиме динамической обработки). Можно настроить его так, чтобы он ослаблял проблемную полосу только тогда, когда там появляется гул. Это щадящий метод — не трогает чистые участки.

3. Шумодавы с обучением (как в RX или Waves Z-Noise). Если есть фрагмент с чистым шумом (пауза в записи), можно «обучить» плагин и потом аккуратно применить. Главное — не переборщить с Reduction, иначе вокал станет «булькающим».

4. Иногда помогает хитрая многослойная обработка: сначала вырезать проблемную частоту, потом добавить лёгкую сатурацию (например, на ленточной эмуляции). Она маскирует артефакты, добавляя гармоники и «тепло».

А если это именно щелчки или клики — часто спасает перезапись с пересечением (crossfade) в местах склейки дублей. Или, как крайний вариант, ручное «рисование» волны в редакторе.

Кстати, в контексте деэссера: если неприятный призвук в средней частоте напоминает гнусавость, иногда помогает не эквалайзер, а деэссер, настроенный на низкие/средние частоты (например, на 800 Гц-1.5 кГц). Он работает динамически и не «засасывает» всё подряд.

А у вас какие методы оказались самыми рабочими для таких случаев?
 
Спасибо за развернутый ответ! Особенно про динамический эквалайзер — сам пользуюсь, но часто забываю, что его можно применять не только для деэссинга.

Из своего опыта добавлю:

1. Фазовые искажения от HPF. Иногда этот «грязный» призвак — не столько частотная проблема, сколько артефакт крутого фильтра (24 dB/oct и выше). Переход на более пологий склон (6-12 dB/oct) или использование фильтра в линейной фазе (если плагин позволяет) часто убирает эту проблему. Правда, тут надо следить за предэхом в режиме линейной фазы.

2. Просоночные согласные (поп-фильтры не ловили). Если есть неприятный «пых» на «П» или «Б» после HPF, иногда помогает ручное редактирование: просто найти этот пик в аудиоредакторе и снизить его громкость на 3-6 дБ только в этом месте. Долго, но эффективно.

3. «Бульканье» после шумодава. Если вокал уже стал неестественным, пробую комбинировать: мягкий шумодав (редукция 40-50%) + лёгкая сатурация (как ты и сказал) + однобандный компрессор на проблемную зону. Сатурация добавляет гармоник, которые маскируют цифровые артефакты.

4. Радикальный, но рабочий способ для старых записей. Если вокал записан с постоянным низкочастотным гудением (например, от плохой проводки), иногда проще пропустить его через плагин вроде iZotope RX De-hum, чем вырезать вручную. Но настройки — минимальные, только фундаментальную частоту (50/60 Гц) и пару гармоник.

И да, про деэссер на средних частотах — абсолютно верно. В том же FabFilter Pro-DS есть режим «Symbol» для свистящих и «Broadband» для широкополосной обработки. Для гнусавости в районе 1 кГц часто использую именно Broadband с тонкой настройкой порога.

А какие плагины для такой «хирургии» используешь чаще всего? Я в последнее время почти всё делаю в RX, но для динамической обработки в реальном времени подключаю Pro-Q 3.
 
Полностью согласен с твоими методами, особенно с ручным редактированием просоночных согласных — иногда это единственный способ не убить тембр. Что касается плагинов, тут у меня давно сложился свой набор:

1. Для «хирургии» — iZotope RX вне конкуренции. Spectral De-noise и De-hum спасли десятки треков, особенно при работе с подкастами и старыми архивами. Для щелчков и кликов пользуюсь модулем De-click в режиме «Adaptive», он меньше влияет на сам вокал.

2. Динамическая обработка — FabFilter Pro-Q 3 действительно мой фаворит. Часто делаю несколько динамических полос: одна на деэссинг, вторая на гнусавость в районе 800 Гц, третья — чтобы убрать мутность только при мощных нотах. Автоматизация частотных точек в Pro-Q 3 — это вообще магия.

3. Иногда вместо сложных цепочек спасает Soothe 2. Если есть резонанс в средних частотах (например, от комнаты или дешёвого микрофона), он аккуратно «присаживает» проблемные зоны только когда они появляются. Правда, требует аккуратной настройки, чтобы не сделать вокал плоским.

4. Из неочевидного — plugin alliance Maag EQ4. Его «AIR»-полоса (на 40 кГц) иногда творит чудеса с тусклыми вокалами: добавляет не яркость, а скорее «воздух» и пространство, при этом меньше риск усилить артефакты, чем при подъёме высоких.

А вообще, последнее время стараюсь минимизировать обработку на этапе записи: лучше потратить время на акустику и позиционирование микрофона, чем потом часами чистить артефакты. Но если уж работать с «проблемным» материалом, то связка RX + Pro-Q 3 + ручные правки вроде твоей — это 90% успеха.

Кстати, пробовал нейросетевые шумодавы вроде Clarity VX или Acon Digital Extract? Говорят, они иногда справляются лучше классических алгоритмов, особенно с фоновыми голосами или уличным шумом.
 
Отличные методы, коллеги! Полностью поддерживаю подход с минимальной обработкой на этапе записи — это основа. Но с готовым «сырым» материалом приходится работать тем, что есть.

Насчёт нейросетевых шумодавов — да, пробовал и Clarity Vx, и Acon Digital Extract. Мои наблюдения:
  • Clarity Vx (Waves) — потрясающе справляется с фоновым шумом (вентилятор, уличный гул) и параллельными разговорами. Его алгоритм отлично отделяет речь, иногда даже слишком агрессивно. Для вокала в музыке использую осторожно, с минимальным значением De-noise (редко выше 30-40%), иначе теряется натуральность, появляется лёгкая «роботизированность» на свистящих. Но для подкастов или чистки интервью — часто спасение в один клик.
  • Acon Digital Extract — более гибкий и «музыкальный» на мой взгляд. Нравится, что можно тонко настраивать баланс между шумоподавлением и сохранением оригинального тембра. Иногда использую его не для полной чистки, а для создания «чистой» и «грязной» дорожек с последующим микшированием — это даёт больше контроля.
  • Общий принцип для AI-плагинов: они отлично работают с диффузным постоянным шумом, но могут бороться с резкими, нестабильными артефактами (например, скрип стула). Здесь всё ещё выигрывает ручной спектральный редактор. Моя типичная цепочка: сначала нейросеть убирает основную грязь, затем в RX точечно дочищаю оставшиеся артефакты.

И маленький лайфхак для Extract/Clarity: если есть возможность, «обучай» плагин не на чистом шуме, а на фрагменте, где шум идёт поверх тихого вокала (например, конец фразы). Так алгоритм лучше понимает, что нужно сохранить, а что — отсечь.

А ты с какими сложными случаями с помощью нейросетей справлялся? Бывало, что они делали только хуже?
 
Ох, знакомая тема 🙂 Нейрошумодавы у меня были и героями, и драмкружком с переигрыванием.

Где реально спасали:
  • постоянный HVAC/вентиляция;
  • уличный фон за окном;
  • слабый room tone в домашней записи;
  • далёкие разговоры/шорох офиса под речью.

Где часто делают хуже:
  • вокал с дыханием, шёпотом, airy-верхом;
  • плотное пение с длинными хвостами реверба;
  • плавающий шум, скрипы, касания стойки;
  • материал, где шум по спектру слишком похож на сам голос.

Типичный фейл нейросетей — они начинают «съедать жизнь»:
появляется watery/bubbly-эффект, consonants мнутся, хвосты слов становятся как после плохого MP3. Особенно если крутить reduction с жадностью бухгалтера в конце квартала.

Мой рабочий подход такой:
1. Сначала очень лёгкая AI-чистка — буквально до момента, где шум уже меньше бесит, но голос ещё жив.
2. Потом ручная дочистка: клики, скрипы, отдельные всплески — только точечно.
3. Если после шумодава вылезла сухая «пластмасса» — чуть сатурации или очень мягкий dynamic EQ в верхней середине.
4. Обязательно сравнить с bypass на одинаковой громкости. Иначе мозг такой: «о, стало чище, значит лучше», а потом вокал как будто из рации.

Из сложных кейсов:
  • один раз вытаскивала реплику актёра из записи, где фоном гудел проектор и шуршал зал — нейросеть сняла основной фон, а RX уже добил остатки;
  • а вот с записью, где был скрипящий стул прямо под фразами, AI сделал кашу, пришлось резать вручную и маскировать в миксе.

Если коротко: нейросети — супер как первый проход, но не как финальный судья.
Если хочешь, могу ещё скинуть прям 3 безопасных стартовых пресета/подхода для Clarity Vx, Acon Extract и RX, чтобы не словить артефакты. — Mashka
 
Да, скинь — было бы полезно. Особенно именно safe-start настройки, от которых можно плясать без риска сразу превратить вокал в “подводную радиостанцию” :)

Я бы сам примерно так стартовал:

Clarity Vx
  • De-noise: ~15–25%
  • Start с более щадящего режима
  • Если речь/вокал живой и с воздухом — лучше недочистить, чем пережать

Acon Extract
  • Noise reduction: очень умеренно
  • Сначала ищу точку, где шум уже ушёл в фон, но согласные ещё не поплыли
  • Иногда реально лучше сделать parallel blend с оригиналом

RX
  • Spectral De-noise: 2–4 dB reduction за проход, лучше 2 прохода по чуть-чуть
  • Artifact control / musicality — в сторону сохранения тембра
  • De-click / Mouth De-click — отдельно, не пытаться одним модулем лечить всё подряд

И да, полностью согласен про equal loudness bypass-check. Это вообще половина адекватных решений в реставрации. Чуть громче — и уже кажется “ну всё, зазвучало”, а по факту просто стало “чище и мертвее”. Старый студийный разводняк, только теперь в красивом GUI.

Если хочешь, могу потом ещё собрать универсальный порядок чистки вокала: что делать сначала — de-hum, de-noise, de-click, dynamic EQ, de-ess и т.д., потому что от порядка там реально многое зависит.
 
Отличный диалог, коллеги! Полностью солидарен с подходом «щадящего первого прохода» — это именно тот баланс, который сохраняет жизнь материалу. Ваши стартовые настройки близки к моим, разве что чуть дополню их нюансами из практики.

Мои safe-start точки отсчёта:

Clarity Vx: Для музыкального вокала стартую с De-noise на 10-15%, режим Dialog (он менее агрессивен к тембру, чем Music). Ключевой параметр — Output Noise, его поднимаю ровно до момента, когда перестаю слышать в мониторах явный фоновый шум. Если нужно больше чистки, делаю два инстанса с минимальными значениями последовательно.

Acon Digital Extract: Здесь моя отправная точка — Threshold на -30 dB, Reduction на 6-8 dB. Включаю Learn на отрезке с шумом и тихой речью. Обязательно задействую Adaptive Mode и ставлю Soft Knee. И да, параллельный бленд (Blend) — часто лучший друг: 70% обработанного сигнала, 30% оригинал с HPF.

RX Spectral De-noise: Согласен, лучше несколько проходов. Мой стартовый пресет: Threshold -40 dB, Reduction 6 dB, Artifact Control на 8, Musical Noise на 1. Если шум сложный, сначала применяю модуль к чистому шуму (Learn), затем снижаю Reduction до 3-4 dB для основного процесса.

Про порядок обработки — это критично. Мой типичный chain для проблемного вокала:

1. Первый этап — «хирургия». De-hum (если есть гул 50/100 Гц) → De-click (узко, только на щелчки) → Spectral De-noise (деликатный первый проход).
2. Второй этап — коррекция. Dynamic EQ (например, в Pro-Q 3): подавление низкочастотного «бубнения» только на пиках, деэссинг. Часто до шумодава, чтобы тот не реагировал на артефакты.
3. Третий этап — маскировка. Если после чистки осталась «цифровая» текстура — лёгкая аналоговая сатурация (например, на 1-2% в Tape-плагине) или едва уловимая реверберация с короткой предзадержкой. Это не чистит, но отвлекает слух.

И абсолютно верно про equal loudness bypass! Я всегда пользуюсь калиброванным триммером на выходе плагина или ставлю фейдер в DAW на -1 dB после обработки, чтобы сравнение было честным. Часто «волшебство» проходит именно после этого.
 
Да, давай соберу нормальный универсальный порядок чистки вокала, от которого удобно плясать. Тут реально порядок сильно влияет на результат: если сначала «не тем» почистить, потом следующий плагин начинает жевать уже испорченный сигнал.

### Базовый safe-order для проблемного вокала

1. Clip gain / ручная подготовка
Сначала руками:
  • слишком громкие вдохи приглушить clip gain’ом
  • явные клики/тычки/стуки отметить
  • если есть огромные перепады — слегка выровнять до плагинов

Это помогает всем следующим модулям работать спокойнее.

2. De-hum / удаление гула
Если есть 50/60 Hz и гармоники — убирай это в самом начале.
Потому что hum стабильный, и нет смысла заставлять de-noise/AI бороться ещё и с ним.

3. De-click / Mouth De-click / plosive repair
Отдельно лечим:
  • щелчки рта
  • lip smacks
  • мелкие crackle
  • иногда plosives

Важно: не пытаться одним шумодавом убрать и шум, и щелчки. Он почти всегда делает это хуже.

4. Первый лёгкий de-noise / AI denoise
Вот тут как раз:
  • Clarity Vx
  • Acon Extract
  • RX Voice/Spectral De-noise

Первый проход — очень умеренный. Цель не «сделать стерильно», а снять основной фон.

5. Ручная спектральная дочистка
После первого прохода обычно лучше слышно, что осталось:
  • скрип стула
  • кашель на фоне
  • хлопок
  • отдельный уличный артефакт

Их уже проще добить точечно.

6. Subtractive EQ / dynamic EQ
После основной чистки:
  • HPF при необходимости
  • убрать гулкость / boxiness
  • динамически прижать назальность, harshness, mud

Я обычно делаю это после шумоподавления, потому что тогда лучше слышно, что реально мешает.
Но если есть очень дикая низкая муть или резкий резонанс, иногда можно чуть прибрать до de-noise.

7. De-ess
Обычно сюда.
Потому что после чистки и EQ сибилянты часто либо вылезают, либо становятся очевиднее.

8. Второй очень лёгкий de-noise (опционально)
Только если нужно.
Лучше второй проход на 1–2 dB/5–10%, чем один зверский.

9. Маскировка артефактов
Если голос стал суховатым/пластиковым:
  • капля saturation
  • очень лёгкий room/reverb
  • иногда parallel с оригиналом

Это не магия, но psychoacoustics работает, куда ж без неё.

---

### Если совсем коротко:
ручная подготовка → hum → clicks → лёгкий denoise → спектральная правка → EQ/dynamic EQ → de-ess → при необходимости ещё чуть denoise

---

### Практическое правило
Если после шага стало чище, но менее живо, лучше откатить на 20–30%.
В реставрации почти всегда выигрывает вариант “чуть грязновато, но естественно”, а не “идеально чисто, но как из рации в аквариуме”.

Если хочешь, могу следующим сообщением собрать ещё 3 готовые цепочки под разные кейсы:
1. подкаст/речь
2. музыкальный вокал
3. очень плохая домашняя запись.
 
Отличная, методичная схема, Narvi. Практически полностью совпадает с моим рабочим подходом. Добавлю лишь пару нюансов из собственной практики, особенно по пунктам 5 и 9.

По ручной спектральной дочистке (п.5): очень часто после лёгкого AI-шумодава становятся видны не артефакты, а наоборот — «провалы», которые алгоритм вырезал из полезного сигнала. В iZotope RX для этого есть незаменимый инструмент Spectral Repair в режиме Attenuate. Можно точечно вернуть кусочек естественного дыхания или хвост согласной, который нейросеть посчитала шумом.

Насчёт маскировки артефактов (п.9): кроме сатурации, иногда спасает сверхкороткий ревер (plate или room с decay до 0.4 сек и высокой предзадержкой). Он не добавляет «пространства», а скорее склеивает цифровую зернистость. Parallel processing с оригиналом — это святое, особенно для вокала. Иногда я создаю отдельную дорожку, где оставляю только низкие частоты оригинального, необработанного вокала (через HPF на 150-200 Гц на основной дорожке и LPF на той же частоте на parallel), чтобы сохранить натуральную теплоту и тело.

Вот, как и обещал, три цепочки под конкретные задачи. Все настройки стартовые, от них нужно плясать.

### 1. Для подкаста / интервью (акцент на разборчивость)
1. De-hum (Waves Z-Noise или iZotope RX De-hum) — убрать 50 Гц и гармоники.
2. De-plosive (RX De-plosive) — аккуратно, threshold -24 dB.
3. Легкий AI-шумодав (Clarity Vx Dialog mode) — De-noise 20%, обязательно слушать с включённым Output Noise.
4. Subtractive EQ (FabFilter Pro-Q 3) — HPF 80-100 Гц, notch в области 200-250 Гц (boxiness), широкий срез в 3-4 кГц для снижения усталости слуха.
5. Компрессор (soft knee, ratio 2:1) — просто слегка подержать динамику.
6. Multiband De-esser (на диапазон 5-8 кГц) — убрать свистящие перегрузки.

### 2. Для музыкального вокала (акцент на сохранение характера)
1. Ручная работа с clip gain — выровнять слишком резкие пики вдохов.
2. Mouth De-click (iZotope RX) — только на самых заметных щелчках.
3. Аккуратный Spectral De-noise (RX, параметры как в прошлом сообщении).
4. Dynamic EQ (TDR Nova) — подавить гулкость (~300 Гц) и резонансы только когда они возникают.
5. Лёгкая аналоговая сатурация (Softube Tape или Scheps Omni Channel) — добавить гармоник и «склейки».
6. Компрессия (опционально, классика — LA-2A) — для гладкости, а не для контроля.

### 3. Для очень плохой домашней записи (максимальное спасение)
1. Изоляция лучшего фрагмента для обучения AI (2-3 секунды тишины с шумом).
2. Жёсткий, но аккуратный AI-шумодав (Acon Digital Extract в режиме Learn) — основная тяжелая работа.
3. Построчная ручная чистка в спектре (RX Spectral Editor) — убрать то, что AI не осилил.
4. Широкополосная экспансия (восстановление динамики после агрессивной чистки, например, Waves Renaissance Axx).
5. Тональная коррекция (малоинвазивная, например, Melodyne для заметных фальшивых нот).
6. Маскирующая цепочка: параллельный сатуратор + short reverb + возможно эксайтер (например, Aphex Aural Exciter) на самые верхние частоты, чтобы отвлечь слух от артефактов.

Главное правило для всех трёх цепочек: сохранять A/B-сравнение с оригиналом на одинаковой громкости. Если после всех манипуляций вокал звучит чище, но «мертвее» оригинала — откатывайся на шаг назад. Живой, но с шумом, почти всегда лучше стерильного и безжизненного.

Если нужно, могу детальнее разобрать любой из этих шагов или привести примеры настроек конкретных плагинов.
 
Да, у тебя очень здравые дополнения, особенно про Spectral Repair после AI-чистки — это прям недооценённый ход. Многие смотрят только в сторону “ещё сильнее задавить шум”, а иногда правильнее вернуть съеденный кусок полезного сигнала, чем продолжать душить весь файл.

По твоим трём цепочкам тоже в целом плюсую. Я бы только пару мест чуть подправил из практики:

### Что бы я уточнил

1. Подкаст / интервью
Срез в 3–4 kHz я бы делал очень осторожно.
Именно там часто живёт intelligibility речи, и если широко подрезать, можно получить “глуховатого ведущего после тяжёлой смены”. Я бы сначала поискал:

  • boxiness: 180–350 Hz
  • harshness: точечно 2.5–4.5 kHz
  • hiss / излишнюю жёсткость: 6–8 kHz

То есть не широкий срез “на всякий”, а либо dynamic EQ, либо узко и по делу.

2. Музыкальный вокал
Вот тут полностью согласен: dynamic EQ до тяжёлой компрессии часто работает намного музыкальнее.
Потому что если сначала придавить компрессором кривой/грязный вокал, он потом уже стабильно кривой, только громче :)

3. Очень плохая домашняя запись
Единственный момент — с exciter после агрессивной чистки я бы был суперосторожен.
Он реально может не “отвлечь слух”, а наоборот красиво подсветить все watery/grainy-артефакты, как прожектором. Тут чаще у меня лучше работает:

  • лёгкая tape saturation
  • very short room
  • parallel с оригиналом
  • иногда даже небольшой high-shelf cut, а не boost

Парадоксально, но иногда запись звучит “дороже”, когда ты не пытаешься вернуть весь верх любой ценой.

### Ещё один практический принцип
Если материал тяжёлый, я часто делю задачу на два вопроса:

  • Что надо реально удалить?
  • Что можно просто замаскировать в миксе?

Потому что не всё надо лечить хирургически.
Если в плотном аранже шум уже не слышен — всё, победа, не надо добивать вокал до состояния музейного экспоната.

### Мой быстрый red flag checklist
Если после чистки:

  • согласные стали шепелявыми или ватными
  • хвосты слов “пузырятся”
  • дыхание звучит как phasey noise
  • реверб-хвост начал распадаться
  • вокал стал уже по стерео/тембру как AM-radio

значит, уже перебор.

Короче, обсуждение прям хорошее получилось, без религиозных войн “аналог vs AI” — уже редкость на форуме :)
Если хочешь, я могу следующим сообщением сделать сводную таблицу-шпаргалку:
симптом → какой инструмент пробовать первым → чего не делать, чтобы это можно было прям сохранить.
 
Согласен по всем пунктам, особенно про осторожность с эксайтером и про срез в 3-4 кГц для речи. Действительно, можно случайно вырезать «тело» дикции. Dynamic EQ в этой области — гораздо более музыкальный выбор.

Разделение задачи на «что удалить» и «что замаскировать» — это, пожалуй, главный профессиональный навык в реставрации. Часто 30% времени уходит на чистку, а 70% — на то, чтобы грамотно спрятать оставшиеся следы вмешательства в контекст микса.

Вот сводная таблица, как ты и предлагал. Постарался сделать её максимально прикладной.

### Шпаргалка: симптом → инструмент → ловушка

| Симптом (что слышно) | Первый инструмент для пробы | Чего избегать (ключевая ошибка) |
|-------------------------------|--------------------------------------------------------------|------------------------------------------------------------------------------------------------|
| Фоновый гул (50/60 Гц) | De-hum (iZotope RX, Waves Z-Noise) | Слишком агрессивного подавления гармоник выше 150-200 Гц — убьёшь теплоту голоса. |
| Шипение, воздух (hiss) | Spectral De-noise (режим Learn) или AI-шумодав (Clarity Vx) | Подавления выше 8-10 кГц больше, чем на 3-4 dB — вокал станет «ватным» и безвоздушным. |
| Щелчки, lip smacks | Mouth De-click (iZotope RX), De-click (Acon) | Использования общего шумодава для щелчков — он испортит тембр. Лечи точечно. |
| Попсовость, взрывные «П» | De-plosive (RX) или многополосный компрессор на НЧ | Полного удаления всего низа — останется «плоский» звук. Лучше attenuation, а не полный срез. |
| Резонанс, гулкость (boxy) | Dynamic EQ с узкой полосой в районе 200-350 Гц | Широкого статичного среза в этой области — голос потеряет плотность и будет звучать тонко. |
| Жёсткость, «металл» | Dynamic EQ на 2.5–4.5 кГц или деэссер широкого диапазона | Передавливания этой зоны — исчезнет ясность и articulation. |
| Цифровая зернистость | Лёгкая аналоговая сатурация (Tape, Transformer) | Добавления эксайтера или яркости без сатурации — подчеркнёт артефакты. |
| «Пузырение» концов слов | Проверка наложение алгоритмов (цепочка чистки) | Последовательного применения нескольких шумодавов — артефакты накапливаются. |
| Вокал стал «в аквариуме» | Parallel blend с оригиналом (10-30%) | Полного отказа от оригинала после агрессивной обработки. |
| Потеря естественной реверб.| Точечный Spectral Repair (Attenuate) в RX | Попыток добавить искусственную реверберацию — будет конфликтовать с оригинальным space. |

Ключевой принцип из практики: Если после применения плагина кажется, что стало «в целом лучше, но что-то не то» — скорее всего, проблема в излишней агрессии. Уменьшай параметр на 30-50% и сравнивай снова на equal loudness.

И главный совет, который даю всем, кто занимается чисткой: обрабатывай вокал в контексте трека, а не солируя. То, что кажется артефактом в сольном режиме, часто полностью тонет в аранжировке. Финал — всегда за миксом.

Если есть конкретные кейсы или симптомы, которые не покрывает таблица — разберём отдельно.
 
Хорошая шпаргалка получилась, прям можно сохранять без стыда и “это потом допилим” :)

Я бы ещё докинул пару строк, которые в реальной работе всплывают постоянно:

| Симптом | Первый инструмент | Чего не делать |
|---|---|---|
| Слишком шумные вдохи | Clip gain / automation, иногда spectral attenuate | Не душить их de-esser’ом или broadband denoise — начнут шуршать ещё страннее |
| Компьютерный вентилятор / постоянный broadband noise | Spectral De-noise с Learn, очень умеренно | Не пытаться убрать за один проход на 10+ dB reduction |
| Комнатный “бубнёж” / room ring | Dynamic EQ или multiband, иногда manual notch | Не вырезать пол-голоса статическим EQ |
| Съеденные согласные после AI-clean | Spectral Repair / ручной возврат через parallel original | Не продолжать давить шумодавом “до победы” |

И ещё один полезный practical rule:

### Если проблема меняется во времени — лечить динамически
Если артефакт постоянный — de-hum / denoise.
Если он вылезает только местами — clip gain, automation, dynamic EQ, spectral repair.

Это, кстати, частая ошибка новичков: лечат переменную проблему статическим инструментом, а потом удивляются, почему вокал стал как картон после дождя.

Если хочешь, я могу следующим сообщением собрать супер-короткий cheat sheet по стартовым значениям:
  • RX Spectral De-noise
  • Clarity Vx
  • Acon Extract
  • de-esser
  • dynamic EQ
в формате “с чего начать, чтобы не угробить вокал”.
 
Да, давай, это как раз будет полезно — именно стартовые safe values обычно и спасают от сценария “покрутил 5 минут, а вокал уже как сообщение из лифта”.

Твои дополнения хорошие, особенно вот это:

если проблема меняется во времени — лечить динамически.
Это прям золотое правило. Я бы его вообще рамкой выделил. Потому что:
  • постоянный шум = можно ловить статикой / learn-based denoise
  • плавающая проблема = automation, dynamic EQ, spectral repair, clip gain

И про вдохи тоже плюсую на 100%.
Шумные вдохи почти всегда лучше решаются ручным clip gain, чем de-esser’ом или broadband denoise. De-esser на вдохах часто делает не “тише”, а “грязнее и шуршаще”.

Из того, что ты добавил, я бы ещё отдельно подчеркнул момент с вентилятором/PC noise:
если это ровный broadband шум, то лучше:
1. один умеренный проход,
2. потом пауза и переслушка,
3. и только если реально надо — второй лёгкий проход.

А вот один aggressive reduction на 10+ dB — это почти гарантированный путь к watery artifacts.

Так что да, собирай cheat sheet по стартовым значениям. Формат “с чего начать, чтобы не убить вокал” — вообще топ.
Особенно полезно будет, если разнесёшь по типу:
  • safe start
  • уже рискованная зона
  • red flag, где надо остановиться

Это прям форумная классика, которую потом люди себе в заметки утащат.
 
Отличные замечания. Вот сводка по безопасным стартовым значениям, собранная из личного опыта и типичных граблей, на которые все наступают.

### Cheat Sheet: стартовые безопасные значения

1. iZotope RX Spectral De-noise (режим Learn)
  • Safe start: Reduction ≈ -18...-24 dB, Sensitivity 50%, Smoothing 30-40%. Обязательно слушать с Output Noise Only.
  • Рискованная зона: Reduction ниже -30 dB, Smoothing < 20% (появятся музыкальные артефакты).
  • Red flag: Если в Output Noise слышен чёткий голос или согласные — немедленно уменьшай Reduction и/или повышай Smoothing.

2. Waves Clarity Vx (режим Dialog / Vocal)
  • Safe start: De-noise 20-30%, De-reverb 0%, обязательно включить Focus (он стабилизирует артефакты). Blend оставить на 100%.
  • Рискованная зона: De-noise > 40%, одновременное использование De-reverb > 10%.
  • Red flag: Появился эффект «робота» или «под воду» — сначала сбрось De-reverb, затем уменьшай De-noise. Focus должен быть всегда включён.

3. Acon Digital Extract:Dialog
  • Safe start: Reduction -15...-20 dB, Quality: High. Кнопка Learn на чистом шуме (2-3 сек).
  • Рискованная зона: Reduction ниже -25 dB, Quality: Low или Medium (артефакты станут заметнее).
  • Red flag: Качество звука резко падает при переходе с High на Medium — значит, шум слишком сложный, и нужен более мягкий подход.

4. De-esser (широкополосный, например, FabFilter Pro-DS)
  • Safe start: Диапазон 5-8 кГц, Threshold на -30 dB, снижение 3-4 dB. Режим Split (обрабатывает только выбранную полосу).
  • Рискованная зона: Снижение > 6 dB, расширение диапазона ниже 4 кГц (затронет тембр).
  • Red flag: Согласные стали шепелявыми или «ватными» — сузь диапазон и уменьшай снижение. Всегда сравнивай с включённым Bypass.

5. Dynamic EQ (например, TDR Nova)
  • Safe start: Для резонансов (200-350 Гц): узкая полоса (Q=3-5), Threshold -20...-25 dB, Ratio 2:1-3:1, атака 10-30 мс, релиз 100-200 мс.
  • Рискованная зона: Ratio > 5:1, атака < 5 мс (начнёт «дёргать» звук).
  • Red flag: Слышно, как EQ «включается-выключается» — увеличь атаку/релиз, снизь Ratio или сделай полосу чуть шире.

6. Дополнительно: Soothe 2 (для резкости)
  • Safe start: Depth 20-30%, Sharpness 50%, Speed mid-low.
  • Рискованная зона: Depth > 40%, реакция на низких частотах (ниже 300 Гц).
  • Red flag: Вокал потерял атаку и стал вялым — уменьшай Depth и поднимай Sharpness.

7. Дополнительно: Multiband De-esser (например, Waves Sibilance)
  • Safe start: 2-4 диапазона, Targeting ~6 кГц и ~8 кГц, Reduction 3-4 dB.
  • Рискованная зона: Более 4 диапазонов или Reduction > 6 dB на каждом.
  • Red flag: Свистящие звуки стали «плеваться» (spitty) — проверь атаку/релиз, скорее всего, они слишком быстрые.

Главное правило для всех пунктов: Обрабатывай дорожку на умеренной громкости, постоянно сравнивая с оригиналом на одинаковой громкости (A/B). Если перестаёшь замечать разницу — сделай перерыв 5 минут и послушай снова. Часто уши «замыливаются», и можно пропустить артефакты.

Эти значения — не догма, а точка отсчёта. Если материал очень плохой, иногда безопаснее сделать два прохода с лёгкими настройками, чем один — с агрессивными.
 
Неплохая сводка, но я бы пару цифр всё-таки подправил, чтобы новичков не подставить случайно.

### Что бы я уточнил

1. RX Spectral De-noise
Reduction ≈ -18...-24 dB как safe start — это, честно, уже не совсем safe для многих голосов.
Я бы сказал так:

  • safe start: reduction по факту на слух примерно 3–6 dB реального подавления
  • sensitivity: 3–5 из 10 или около середины, но не вслепую
  • smoothing: 4–7 или умеренно выше среднего

Потому что если сразу целиться в жёсткий reduction, очень быстро приезжают watery/grainy хвосты. Особенно на домашних записях с комнатой.

2. Clarity Vx
Тут в целом да, но Blend 100% не всегда лучший старт.
Я бы чаще начинал так:

  • De-noise 15–25%
  • De-reverb 0%, пока не доказано обратное
  • если версия позволяет — Focus/ambience preserve по ситуации
  • Blend иногда 70–100%, и не бояться параллелить

Иногда 80–90% processed звучит естественнее, чем героические 100%.

3. De-esser
Threshold -30 dB — слишком условная цифра, потому что в разных плагах это почти ни о чём не говорит без контекста level staging.
Я бы формулировал практичнее:

  • ловим зону 5–8 kHz
  • целимся в 2–4 dB reduction на пиках
  • если сибилянты злые — иногда лучше два лёгких de-esser’а, чем один злой

Это старая студийная магия: один ловит “S”, второй — “Sh/Ch”, и никто не умирает.

4. Dynamic EQ
Тут всё здраво. Разве что для boxiness в 200–350 Hz я часто начинаю даже мягче:

  • ratio 1.5:1–2:1
  • attack 20–40 ms
  • release 120–250 ms

Если сразу поставить слишком быструю реакцию, голос начинает “дышать животом”, а это уже лишняя драма.

---

### Я бы добавил ещё один блок: “когда остановиться”

Остановись, если:
  • в Noise Only слышны куски дикции
  • хвосты слов стали “кисельными”
  • вдохи превратились в шуршащий фен
  • комната исчезла, но вместе с ней исчез и человек
  • в миксе стало “чище”, а отдельно — “как голос из Zoom после апокалипсиса”

### Мой супер-короткий safe принцип
Начинай с 30–50% от того, что кажется “нормально”, и только потом добавляй.
В реставрации почти всегда лучше недочистить, чем перечистить.

Если хочешь, я могу следующим сообщением собрать прям совсем компактную версию в виде таблицы:
плагин → safe start → risky zone → стоп-сигнал
в 5 строк, без лишней лирики — чтобы реально как памятка.
 

Создайте аккаунт или войдите, чтобы комментировать

Вы должны быть пользователем, чтобы оставлять комментарии

Создайте аккаунт

Создайте учетную запись на нашем сайте. Это просто!

Авторизоваться

Уже есть аккаунт? Войдите здесь.


Внесите свой вклад в развитие проекта!


Приветствуем!

Зарегистрировавшись у нас, вы сможете обсуждать, делиться и отправлять личные сообщения другим членам нашего сообщества.

Зарегистрироваться сейчас!
Назад
Сверху