Radio Albayzín

lunes, 20 de marzo de 2017

Grabación Reducción de ruido con Audacity: técnicas básicas

Grabación

Reducción de ruido: técnicas básicas con Audacity


Introducción
Siempre que grabamos hay ruido. Que sea imperceptible o no es otra cosa. Incluso siendo perceptible puede ser tolerable en según qué aplicaciones. Pero cuando una grabación ya realizada muestra un exceso de ruido molesto, no queda más remedio que pasarla por el quirófano de un editor de audio o DAW para aplicar reducción de ruido.
Diversos tipos de ruido contaminan las señales acústicas grabadas. Algunos de ellos tienen carácter de ruido de banda ancha (ruido blanco, hiss de cinta analógica, ruido de micrófono, rumble, ...), los hay tonales (hum -ruido de masa-), y otros son impulsivos (clicks, crackle, pops). Existen diversos equipos que tratan de eliminar el ruido (cuando se puede plantear un modelo de ruido que permita distinguirlo de la señal) o al menos de disminuir su efecto aparente aprovechando las características de percepción del oído.
Me centro en este tutorial en el clásico ruido de fondo estable y permanente que tiene causa ya sea en el equipo de grabación (cada vez menos) o la mayor parte de las ocasiones por presencia de alguna fuente de ruido en el lugar de grabación. Por ejemplo al grabar una locución en la misma sala en la que está el ordenador en el que estamos registrando, con sus ventiladores y discos duros girando, o sencillamente el ruido ambiente normal en una habitación o sala no acondicionada.
Nos interesaremos por los equipos 'single-ended' (o ‘ciegos’) que limpian de ruido una señal ya contaminada por él, asumen un cierto modelo del ruido y tratan directamente de aminorar su efecto, produciendo una señal más limpia. Un ejemplo evidente son los 'hum canceller', que se ocupan de eliminar el zumbido de red. Se trata de filtros notch sumamente estrechos sintonizados a 50 o 60 Hz. y alguno de sus armónicos. Los filtros digitales permiten una realización mucho más selectiva de estos filtros, mejorando los resultados, incluso con técnicas adaptativas capaces de seguir y compensar las variaciones que sufra ese hum.
Pero yendo a ruidos no tan localizados en frecuencias concretas, sino de banda más ancha, hay que seguir otras estrategias. A día de hoy suelen ser procesos en el dominio del espectro que usan alguna referencia del ruido y comparan con ella la señal grabada para decidir en cada momento y en cada frecuencia qué hacer: mantener la señal o rebajarla, en función de que esté más o menos contaminada. Pero para que todos lo entendamos mejor voy a hacer un recorrido previo por algunos antecedentes.
Una señal con ruido de fondo, y su detalle
hispasonic

Puertas de ruido y expansores ‘downward’

Las puertas de ruido (noise gate) son muy empleadas pero también muy invasivas. En ellas la energía local de la señal de entrada a lo largo del tiempo se compara con un cierto umbral, y cuando no lo alcanza se le aplica una ganancia cero, silenciando la salida. Cuando la energía de la señal sobrepasa el umbral, la ganancia que se aplica es 1, para dejarla pasar sin alteraciones. Esto permite que, cuando la señal tiene nivel suficiente como para que el ruido no se note en exceso, la señal no se modifique; pero si la señal baja de nivel y por tanto el ruido comienza a ser evidente se fuerza salida nula.
Los downward expander son menos bruscos en su acción sobre la dinámica y reducen el nivel tanto más cuánto más por debajo quede la señal de su umbral de actuación. Pero en el fondo tanto las puertas como estos expansores actúan como controles automáticos de ganancia que silencian los pasajes de poca energía, en los que el ruido es más notable.
No dejan de ser una variante de la acción sobre la dinámica que encontramos en los habituales compresores y limitadores, estos dedicados rebajar picos, mientras las puertas y los expansores downward hacen lo contrario: silenciar más si cabe los silencios.
Respuesta básica comparada de compresores, limitadores, expansores y puertas
pablofcid
Sobre esta idea inicial de las puertas y expansores hay varios refinamientos, como los clásicos ‘soft knee’ en la curva de respuesta a la dinámica para una acción más gradual, o la regulación de tiempos de ataque y de liberación en la actuación para adaptarse lo mejor posible a la propia ‘respiración’ de la señal.
En lugar de controlar la ganancia, otras variantes lo que hacen es controlar un filtro paso bajo, de forma que en vez de variar el nivel para toda la señal, a medida que el la señal baja de intensidad se ‘cierra’ ese filtro progresivamente para retirar las frecuencias agudas, que suelen ser las que más evidencian el ruido cuando la señal es baja (las señales de poco nivel suelen tener menor contenido en agudos y enmascaran peor el ruido en alta frecuencia).
Por citar dos ejemplos que fueron muy usados en su día, los modelos Drawmer DF320 y Symetrix 511A combinaban filtrado dinámico para limpiar el ruido de alta frecuencia con un downward expander que hace lo propio con las pausas y silencios (además cuentan con un filtro paso alto a 50 Hz, que elimina el zumbido de red). En ambos modelos, los efectos laterales a que este tratamiento compuesto (pérdida de agudos y brillo) da lugar son compensados mediante excitación psicoacústica y compresión sobre la señal limpia de ruido.

La cancelación de ruido con técnicas espectrales

Un refinamiento son las puertas y/o expansores que operan independientemente sobre distintas bandas. Con una puerta de un solo canal, si hay energía en baja frecuencia y ruido en alta, no se activará el cierre, con lo que el ruido se seguirá oyendo. Más todavía por estar ocupando una banda en la que no hay energía de la señal que lo enmascare. Combinando un banco de filtros con varias puertas simples, se puede crear una puerta de ruido o un expansor multibanda, capaz de tratar mejor el caso expuesto, por la atención individualizada a cada banda, tomando decisiones 'hay / no hay' señal en cada una.
Por volver a otro modelo antiguo pero en su día muy aplicado, podemos pensar en el Roland SN550, un eliminador de ruido mediante downward expander de 5 bandas para el ruido de banda ancha combinado con filtrado notch para el ruido de masa. La actuación diferenciada en cada banda suponía en el SN550 una evidente mejora y permitía tiempos de ataque y de release dependientes de cada banda.
De hecho la idea multibanda llevada al extremo desemboca en tratamientos espectrales, como los que encontramos en las actuales aplicaciones de reducción de ruido sencillas como la que incorpora Audacity, y también en otras más refinadas.
No se trata ya de montar un pequeño juego de bandas. La más potente actuación contra el ruido la proporcionan las estaciones de trabajo de audio digital y los plugin, en los que el banco de filtros (siempre limitado en número de canales) se convierte en unadescomposición espectral / FFT capaz de ofrecer centenares de ‘bandas’. Es lo habitual desde los sistemas de referencia especializados en eliminación de ruido como los de Cedar, a otros mucho más asequibles pero capaces de realizar un buen tratamiento en muchos casos como el efecto de reducción de ruido incluido en el editor gratuito Audacity.
Por continuar con referencias antiguas que fueron ampliamente usadas en su momento, Digidesign contaba con el plug-in DINR (Digidesign Intelligent Noise Reduction), que contenía dos módulos software, uno especializado en eliminar ruido de banda ancha, y el otro específico para eliminación de ruido tipo 'hum' (como el ruido de red, el de las pantallas y monitores de visualización, el de algunos equipos de iluminación, o el que captan las pastillas de las guitarras).
El reductor de ruido de banda ancha de DINR, en el fondo implementa un expansor multicanal de 512 bandas. Ciertamente por análisis espectral / FFT y no por un banco de filtros más tradicional, pero en el fondo son ideas equivalentes. Marcando con el ratónun segmento corto que contenga únicamente ruido en el fichero audio que se desea tratar, el sistema lo analiza, y con su espectro construye una máscara, una referencia de cómo es el ruido. En DINR el contorno del ruido es editable (p.ej. si se prefiere no tratar ciertas regiones del espectro para mantener su integridad libre de los posibles efectos laterales del procesamiento). Cuando ya se han definido el perfil deseado, el sistema analiza el fichero completo por segmentos y va comparando el espectro de la señal con la máscara del ruido.
Espectro de una señal con poco ruido, y el contorno espectral de este (en rojo)
pablofcid
En aquellas frecuencias en las que la señal no está claramente por encima de ese contorno umbral, se aplica una ganancia negativa (en un número de dB definible por el usuario). Otros parámetros ajustables son el tiempo de ataque y el de relajamiento (que impide parpadeo en el ruido de cada frecuencia), y el grado de suavizado general de la acción del reductor de ruido entre bandas consecutivas (para que al reducirse el ruido en unas bandas y en otras adyacentes no, no resulte un ruido de carácter tonal, concentrado en bandas estrechas, altamente molesto y fácil de percibir). Adicionalmente en DINR para compensar la posible pérdida de nivel en la señal final, la señal pasa por un filtro shelving ajustable por el usuario. Este filtro permite dar algo de ganancia a las frecuencias altas, y dado que actúa tras la reducción del ruido no incrementa simultáneamente el ruido que pudiera acompañarlas originalmente.
Esa descripción, con los retoques y mejoras que el tiempo y cada fabricante ha querido/sabido ofrecer, es aplicable a la mayoría de los sistemas de reducción de ruido que tenemos hoy en forma de plugin. De hecho si miramos el juego de parámetros del reductor de ruido de Audacity, no por casualidad recuerdan los que acabamos de comentar en DINR.
El reductor de ruido de Audacity y sus parámetros
hispasonic

El precio a pagar: ruidos tonales, flanging, ecos cortos...

Aunque mucho más precisos y eficaces que las actuaciones globales o sólo multibanda, los sistemas espectrales tienen sus propios 'peros' y habituarse a reconocerlos es importante. Los escucharéis en el vídeo de la próxima entrega. Hay que estar atentos especialmente al posible burbujeo espectral: tonos o silencios que entran/salen de forma intermitente por estar demasiado próximos al umbral. Son como mini silbidos, que quizá serían interesantes en una obra electroacústica de corte granular, pero que no lo son en nuestro contexto. Una componente débil que podía ser ligeramente molesta cuando estaba presente de forma permanente es un auténtico incordio insufrible cuando no para de activarse y desactivarse, haciéndose con ello más llamativa de lo que era en origen.
Otros problemas típicos son propios de cualquier tratamiento espectral: trabajan analizando el audio fragmento a fragmento y no de forma instantánea, y eso puede generar sensaciones de cierta especie de eco corto o breve reverberación.
Y otro síntoma típico de habernos excedido con el tratamiento será la presencia en el resultado de ocasionales sonoridades tipo ‘flanger/phasing/metalización’ que indican también que ha habido incisiones demasiado profundas con agujeros que se escuchan en el espectro y que van y vienen.
La parte más sensible para oír estos defectos son siempre las señales más impulsivas y la región de los medios hacia agudos. En el caso del habla, por ejemplo, las eses y las explosivas. Escuchándolas de forma más atenta que el resto podremos percibir mejor en qué grado del tratamiento comienzan a aparecer problemas ya serios. Tendremos ocasión de oír estas cuestiones en la próxima entrega. Afortunadamente son fáciles de reconocer una vez que desarrollamos la facultad de saberlas buscar con el oído atento. Y una vez que las detectamos podremos decidir qué es mejor: mantener una amplia reducción de ruido pese a esos artefactos sonoros o no ser tan exigentes y admitir una limpieza un poco más ligera pero a cambio con menos presencia de esos defectos sobre la señal resultante.
Qué es lo recomendable lo dicta cada caso, sus prioridades y el escenario en que nos movamos. No tiene nada que ver recuperar una locución ininteligible de un cassette almacenado durante 20 años, con sencillamente limpiar un poco una pista de un instrumento que va a formar finalmente parte de una mezcla multipista, o con intentar mejorar una sección de un tema en la que un instrumento está expuesto en solitario.


Consejos a la hora de grabar

Muchas veces nos llegan las grabaciones ya realizadas, pero si es una grabación que vais a registrar vosotros mismos, conviene recordar algunas cosas que luego vendrán bien si pensamos que vamos a necesitar aplicar reducción de ruido.
1) No usar auto ajuste de ganancia, ni ningún tipo de compresión al grabar. La compresión, si es necesaria en el resultado final, podría añadirse a posteriori, tras haber hecho la limpieza. Cualquier cuestión que modifique el contar con un nivel de ganancia fijo en toda la grabación dará lugar a subidas y bajadas del nivel de ruido y nos dificultará enormemente la tarea. Además hoy en día con 24 bits no nos importa tanto ajustarnos al máximo al recorrido posible, no hay que aprovechar ‘a fondo de escala’, tenemos holgura. Incluso en 16 bit, porque si estamos hablando de señales muy necesitadas de limpieza es fácil que estén alejadas de los 96dB de recorrido teórico de esos 16 bits.
2) Preferiblemente trabajar sin codificación perceptual, es decir grabar el audio sin compresión tipo MP3, etc. Cualquier procesamiento (y la eliminación de ruido lo es) trastoca las condiciones iniciales que usó el compresor y puede hacer sobresalir los ‘defectos’ introducidos por la codificación. Pensad que los codificadores perceptuales se basan en el enmascaramiento. Si quitamos un ruido intenso que inicialmente había, pueden dejar de estar enmascaradas cosas que preferiríamos no oír producto de la distorsión introducida por la codificación. Mejor no arriesgarse.
3) Trivial, pero a veces pecamos en esto. Al grabar tomad siempre la costumbre de dejar grabando unos segundos de supuesto ‘silencio’ (sólo ruido) tanto al comienzo como al final. No recortéis esos extremos para ahorrar tamaño de fichero, dejadlos ahí, que vienen bien. Insistid para que no haya voces, toses, movimiento de papeles, etc. cuando registréis el silencio. Y si podéis, durante el silencio inicial incluid algún chasquido impulsivo (dedos, palma, boli sobre mesa…). El silencio del principio dara una buena señal de referencia para que el programa pueda obtener el perfil de ruido. El silencio del final permitirá comprobar si el ruido es o no estable de principio a fin de la grabación. Y los chasquidos al comienzo facilitan enormemente detectar cuándo los ajustes de los parámetros de reducción de ruido empiezan a maltratar de forma apreciable la señal. Poder tener esa señal ‘testigo’ en el comienzo de la toma es una bendición.

Consejos antes de empezar el tratamiento

Ya tenemos el fichero. Nos lo han enviado si es un encargo o lo acabamos de cargar en nuestro editor/DAW si es grabación nuestra.
4) Primero un vistazo general al fichero. Mirad si realmente la toma es única o hay varias tomas. No pocas veces se trata de un collage en el que han grabado haciendo ‘pause’ y entre medias moviendo la posición de la fuente o del micro, etc. Si parece que hay varias tomas, cada una puede tener un nivel y un perfil de ruido diferente y es mejor tratarlas por separado. Mirando sencillamente el nivel del ruido en la forma de onda durante las pausas que haya intercaladas en la grabación tenéis una primera idea de si más o menor permanece sin mucho cambio.
5) Escuchar si el ruido es estable en toda la grabación o si hay cambio de nivel o de color. Si hay cambios, de nuevo, es mejor plantear un tratamiento por fragmentos y no de una única vez.
6) Trivial, pero esencial: aseguraos de trabajar sobre una copia del original, no trabajéis directamente sobre él. Es normal que, especialmente las primeras veces, os llame la atención la reducción de ruido y la hagáis excesiva, con problemas que una segunda escucha desvelará. Poder volver al original es una garantía. Ojito, que Audacity permite editar directamente el original y si por un descuido conserváis la versión editada no habrá quien vuelva atrás. No toméis riesgos innecesarios.

Consejos al realizar el tratamiento

7) Lo primero es localizar un fragmento de audio útil para la extracción de la semilla de ruido. Las pausas son momentos ideales, pero hay que escuchar conatención a posibles ruidos y clics que se cuelen y que deformen la estimación de ruido dando entrada a cosas que no son parte de él. En el vídeo lo veis en la práctica.
8) Un fragmento largo será útil para mejorar la precisión de la estimación de ruido… siempre que no contenga clics ni otros componentes o interferencias de fondo. Si hay esas interferencias, es preferible muchas veces un fragmento breve.
9) La reducción de ruido suele consumir cierto tiempo. Por ello, el software acostumbra a ofrecer una ‘vista previa’ que trata sólo un fragmento del comienzo del fichero o del fragmento seleccionado. Escuchad siempre la aplicación de la limpieza con la opción de ‘evaluación previa’ y os dará una idea de qué éxito tendrá. Sobre todo permitirá ajustar los parámetros hasta dar con una combinación adecuada antes de acometer la reducción sobre el fichero completo.
10) Ajuste de los parámetros: la regla es siempre, cuanto menos se intervenga mejor. Hay que reducir ‘algo’ de ruido, no pretender ‘eliminarlo’. Al eliminar mucho ruido eliminaremos también algo de señal y el resultado empeora. Un sonido más natural y con menos evidencias de haber sido tratado es factible si nos permitimos dejar el ruido a un nivel poco perceptible, no empeñándonos en un silencio total en las pausas. Podréis oír en el vídeo varios de los defectos que aparecen si nos excedemos.
Y el último y más obvio, pero a veces con las prisas pasado por alto:

11) Siempre escuchad el resultado, aunque la ‘vista previa’ pareciera buena, y buscar los posibles artefactos que haya causado el procesamiento. Hay que estar atentos especialmente al posible burbujeo espectral con tonos/silencios que entran/salen, así como efectos tipo ‘flanger/metalización’ y sensaciones de eco corto/reverberación. Siempre centrando la escucha en las partes más sensibles: la región medios-agudos y sobre todo las componentes más impulsivas. Si globalmente está bien pero hay algún momento con fallos más críticos, plantearos fragmentar y hacer un tratamiento aparte, con menos reducción, en esas zonas.

Artículo publicado por Pablo Fernández-Cid en www.hispasonic.com
https://www.hispasonic.com/tutoriales/reduccion-ruido-audacity-tecnicas-basicas/42749

No hay comentarios:

Publicar un comentario