Radio Albayzín

viernes, 24 de marzo de 2017

La era post-diseño sonoro

La era post-diseño sonoro


Rob Bridgett
El diseñador de sonido más que diseñar sonido como tal, es diseñar la experiencia en sí y en su caso esculpirla en lo sonoro. Esto lo que implica, si vamos a un proceso más radical, es el hecho de que el diseñador de sonido deba ausentarse de sí, deba ser capaz de ser uno con el director, no solo por la comunicación sino porque sabe desprenderse de su rol singular para adentrarse en el hecho de pensar la historia, de ser consciente de. lo visual, de lo artístico, de lo conceptual, etc.
Esto lo que le dice al diseñador de sonido es que piense en la globalidad y no se limite a un elemento. Lo que le pide es que se dirigija más allá del diseño sonoro, después del diseño sonoro, antes incluso, pero afuera, capaz de pensar en la experiencia completa. Es precisamente esto lo que el diseñador de sonido Rob Bridgett habla con su experiencia para videojuegos, pero bien se podría aplicar al cine, como lo hace el diseñador de sonido Tim Prebble. Ambos apuestan por una idea que va más allá de la mera colaboración, le exige a la imaginación, y le permite una real creatividad a cualquiera que se adentra a crear en estos medios audiovisuales.
Esta postura tiene su base en un artículo que publicó hace varios años Bridgett en su blog y que nos ha permitido publicar completo en Español en Hispasonic con el fin de hacer eco a tan esenciales palabras. Todo el texto a continuación es de Bridgett:

Después del diseño sonoro

Es decir, diseño sonoro ppara sí mismo, para edificación, gratificación o engrandecimiento, el enfoque unidimendional, con exclusión de todo lo demás. Estoy interesado en el diseño como un todo. Cómo todos los elementos, la artesanía, el proceso de cómo una banda sonora puede convertirse en una pieza imposible de substraer del diseño total. Estoy extremadamente e interminablemente fascinado por esta disciplina de diseño más amplia, en la presentación, en el tiempo, en cómo el juego, la escena de corte o el gameplay es percibido, como un todo, por un jugador. Durante muchos años, tal vez comprensiblemente como miembros de equipos de producción sin franquicia, nosotros la gente de sonido nos hemos eleveado y y hemos elevado a nuestros equipos bajo el estandarte del "50% de la experiencia sonora", y aunque esta elevación ha cumplido su propósito en revelar la importancia del sonido para una experiencia, es meramente didáctico...
El 100% de la experiencia es la experiencia.
El sonido no es nada sin colaboradores, nada sin una dirección de arte, sin una narrativa, sin contextos y estructuras que corren mucho más profundo que lo sónico, necesitamos algo desde lo cual nuestro eco rebote. Del mismo modo, una narración no es nada sin la interpretación (performance) de la voz, el gameplay pesado no es nada sin un latir musical, un momento visceral de una mandíbula-que cae nada sin efectos sonoros afinados a drede en el justo momento. El sonido puede ayudar a resolver problemas, arreglar agujeros, remendar y doblar las intenciones, pero sólo cuando está totalmente involucrado.
Estamos llegando a la era post-diseño sonoro. Es una época ya no obsesiva con el arte "descuidado" de una banda sonora de películas o juegos. Una era en la que los diseñadores de sonido son cómodos, confiados y cumplen su papel como co-diseñadores en un equipo de producto. El foco de cualquier trabajo de los diseñadores de sonido debe ser como un colaborador de primer orden no sólo el proyecto en su conjunto, sino artística, técnica, social y políticamente en el desarrollo de la cultura de la empresa. Debemos esperar y solicitar nada menos que la plena participación y respeto inequívoco otorgado a los directores de arte, directores de diseño o directores técnicos. Necesitamos movernos más allá, en nuestro pensamiento y en nuestras transacciones cotidianas, de la segregación disciplinaria del pensamiento de fin de línea de producción, y empujar confiados al papel abierto del colaborador, sea con clientes, departamentos o nuestras audiencias.
Este movimiento ha sido posible tanto en la producción de películas como de juegos por un cambio de actitud hacia la colaboración con el sonido, y de la necesidad de mejorar el diseño general de las producciones audiovisuales. Despreciar el sonido en casi cualquier discusión (principal) es un descuido de los fundamentos del buen diseño, y no es sólo un descuido del diseño, sino también de un buen negocio.
Esta era es también acerca de alejarse de los límites autoimpuestos de la tecnología y moverse alrededor de un enfoque más equilibrado, donde la tecnología (o las habilidades necesarias para producir el trabajo requerido) juega en igualidad con las preocupaciones estéticas y las habilidades sociales. Estas tres partes (arte, tecnología, social) forman las habilidades clave requeridas por un diseñador de cualquier disciplina que trabaja en cualquier medio hoy. Los diseñadores de sonido jóvenes hoy necesitan aprender rápidamente para moverse y pensar más allá de la última tecnología, ya que cada día habrá algo nuevo que le distraiga del trabajo real de "diseñar" sonido para resolver los problemas de diseño específicos de sus producciones.
Al final, el trabajo se trata de personas, relaciones, equipos, redes, comunidades y responsabilidad mutua.
Espero que esta era post-diseño sonoro sea ejemplificada por el movimiento ascendente de los "diseñadores de sonido" en roles creativos mucho más amplios dentro de los equipos, convirtiéndose en directores creativos, productores y directores. Esto se siente como el siguiente paso natural para la evolución del diseño y la práctica plenamente integrados. En el pasado, donde ha habido falta de comprensión, oportunidades perdidas, falta de innovación, siempre ha habido quienes se han esforzado para llenar el vacío y liderar con el ejemplo. Esto puede no ser el viaje o el destino de todos, pero espero que sea el destino de las formas de arte que amamos, y muchos de nosotros jugaremos, o ya estamos jugando sin saberlo, un papel clave a través de los juegos que ayudamos a diseñar.

Artículo publicado por Miguel Isaza en www.hispasonic.com
https://www.hispasonic.com/reportajes/era-post-diseno-sonoro/42751

martes, 21 de marzo de 2017

Reverberación: nociones básicas, acústica y percepción

Reverberación: nociones básicas, acústica y percepción

La reverberación, sin duda, es un aspecto esencial cuando hablamos de cualquier evento no ya musical sino en el que intervenga audio, sea una conferencia, una obra de teatro, un audiovisual, o un concierto. El conjunto de reflexiones que se producen en las paredes del recinto o espacio en el que nos encontramos genera esa cola de reflexiones que llamamos reverberación y que extiende la duración de los sonidos más allá del final de su emisión en la fuente. Las ondas permanecen surcando el aire y rebotando en las paredes hasta que su energía se agota entre tanto viaje y colisión y dejamos de percibir la señal.

Sonido directo, primeras reflexiones, cola reverberante

Si pensamos en un sonido original corto (una palmada, el estallido de un globo, un disparo…), podríamos concebir la producción del sonido original (1 en la figura), su posterior llegada al punto de escucha (2) ya algo reducido en nivel, y la algo más tardía llegada de las reflexiones, entre las que son perceptualmente muy diferentes las más tempranas (3) respecto a la ‘congestión’ que finalmente se alcanza de rebotes indistinguibles superpuestos (4) producto de reflexiones secundarias y terciarias. [Nota: pinchad en la figura para verla en mayor detalle]
Ilustración del proceso de generación de la reverberación

Las primeras reflexiones o early reflections (ER) son especialmente importantespor ser las que corresponden a rebotes directos en las paredes más próximas o en todo caso, antes de que abunden tanto los rebotes que pasen a ser casi un continuo. Llegan pronto y todavía fuertes al punto de escucha.
Poco después, tanto el sonido original como estas primeras reflexiones generan segundos, terceros, etc. rebotes cada vez más débiles individualmente, pero también más complejos y amalgamados, confundidos en una ‘cola’ reverberante difusa en la que no es posible discernirlos individualmente.
Si pintáramos a lo largo del eje de tiempo cada uno de esas llegadas del sonido, tendríamos algo semejante a esto:
Respuesta impulsiva de una sala y sus partes principales

Aunque en esta figura hayamos pintado una única primera reflexión en ‘verde’, las primeras reflexiones son en realidad un conjunto. Forman un grupo que se presenta inicialmente sin que pueda establecerse una frontera nítida entre él y la cola o campo reverberante final. Pero aunque no sean fácilmente separables de forma estricta esas dos partes del hecho reverberante, sí tienen un carácter perceptual muy diferente.

Las primeras reflexiones

La posición temporal de cada una de las primeras reflexiones (ERs) resulta muy significativa perceptualmente. Permite obtener una sensación global de tamaño y configuración de la sala. Informan de la ubicación de las principales paredes y también de dónde están la fuente y el receptor. El patrón que sigan las ERs nos puede hablar de una sala de forma alargada o más equilibrada, de una sala demasiado paralelepipédica o más irregular. Y nos ayuda también a ubicar los instrumentos dentro de la sala. P.ej. un instrumento cercano a una pared tendrá una primera reflexión casi pegada al sonido directo y con un nivel posiblemente fuerte. Si además de estar cercano a una pared estuviera ‘de espaldas’ a nosotros los escuchantes, el sonido directo podría ser más opaco que la propia primera reflexión. Opción por cierto nada habitual en reverbs artificiales, como tampoco es habitual que se toque ‘de espaldas’ al público, aunque pueda tener su gracia.
Además el material de cada pared hará que se absorba de forma diferente el contenido de baja frecuencia y el de alta, dando lugar a que las reflexiones vengan ‘filtradas’, cada una de una forma específica. Por ejemplo un techo sin tratar y muy refractivo y unas paredes laterales cubiertas con cortinas o muebles y libros, harán que la reflexión en el techo sea más brillante y las de las paredes más opacas.
En definitiva, la conformación de las primeras reflexiones (su posición temporal y su ‘color’ espectral) son esenciales y muy relevantes en su detalle para la sensación percibida de ubicación relativa entre fuente, escucha y paredes. Las ER de una reverberación que simule un baño, una habitación, un auditorio, etc. no tienen nada que ver entre sí. Además de las diferencias en el tipo de desarrollo de la cola reverberante, una reverb digital aplica diferentes juegos de ERs para cada algoritmos. Algunas, y eso es bueno, permiten incluso contar con patrones alternativos de ERs para cada tipo de sala. Hay muchas unidades de reverberación digital que permiten elegir entre un repertorio con varias de ellas.
Podréis apreciar enormes diferencias en el carácter de la reverberación final en función del tipo de ERs elegidas. No es la única diferencia entre los algoritmos de reverberación que simulan diferentes espacios, pero sí una que resulta esencial y en la que conviene contar con cierta libertad: varios tipos seleccionables, ajuste de su nivel diferenciado respecto al de la cola, separación en ms. respecto al sonido 'directo',... o incluso más allá con ERs capturadas de posiciones concretas en salas reales. Esas ERs 'muestreadas' de espacios reales son clásicas en reverberadores por convolución, y también hay soft de reverberación para diseñar ERs a partir de la definición de una forma de sala, sus materiales, y ubicando la fuente y la escucha. Esos generadores de ERs calculan el correspondiente patrón, incluso binaural para una correcta sensación estéreo, que podremos aplicar mediante convolución.
Una forma muy útil y realista de conseguir ubicar diferentes instrumentos en una mezcla, pero a la vez dar una adecuada sensación de que los instrumentos comparten un mismo espacio es que cada uno de ellos tenga un patrón de ERs diferente, aunque luego todos envíen su señal a un misma unidad de reverberación destinada a crear la cola reverberante. Es además una solución bien económica en uso de CPU: las ERs son cortas, de decenas de milisegundos. Procesarlas, incluso de forma individual para cada instrumento/pista o en varios grupos para otras tantas ubicaciones virtuales, no exige demasiado uso de CPU. Podemos permitirnos incluso hacer uso de reverbs de convolución sólo para esas ERs variadas sin tener que comprar otros dos o tres ordenadores. Utilizar una reverb completa por convolución para cada instrumento/pista/grupo sí sería capaz de agotar al ordenador más potente, pero no es el caso si configuramos sólo algoritmos o respuestas impulsivas de puras ERs sin cola. La cola puede ser, como decíamos, única y compartida en envío para todas las pistas (eso sí, mejor retirad del algortimo que haga esa cola cualquier presencia de ERs adicionales, que estarían de más y sólo ayudarían a deformar la sensación de separación de ubicaciones lograda con las ERs individuales). Es más, para la cola, una buena reverb algorítmica puede hacer innecesario acudir a una por convolución que es siempre mucho más devoradora de CPU.
En todo caso, seguro que entre vuestras unidades y plugins de efectos encontraréis algunos dedicados sólo a generar ERs. Es hora de sacarles provecho. El que les falte la cola reverberante, lejos de percibirlo como una carencia, es casi una bendición. Os permite hilar fino allí donde se necesita (las ERs) y dejar el devorador de CPU (las colas) en una única instancia de plugin. Y tenerlos aplicados por separado permite un enorme juego para terminar de encajar la mezcla en cuanto a los aspectos de reverberación.
Un excelente y muy práctico ejemplo de esta estrategia de ERs múltiples y cola compartida es la que sensatamente el buen oído de los hispasónicos del taller orquestal recomendaba en un interesante hilo que ya fue portada el pasado octubre y que tiene relevancia más allá del entorno orquestal en el que se debatió. En ese entorno muchas veces las ERs ya vienen 'preimpresas' en las muestras de cada instrumento/sección en las librerías orquestales, haciendo que según para cuales librerías pueda incluso obviarse el tener que crear las ER con reverbs artificiales. Allí veréis ejemplos de librerías que están grabadas a propósito con poca 'cola', algo que también sucederá en las grabaciones con micro 'cercano' en aquellas colecciones que ofrecen varias posiciones de micro.

La cola reverberante

El patrón de primeras reflexiones es específico para cada combinación posición fuente / posición escucha dentro de cada sala. Pero la cola reverberante, sin ser uniforme, es mucho menos dependiente de esas ubicaciones de fuente / escucha. En la cola reverberante el concepto de ‘posición’ de la fuente está en buena medida ausente: las fuentes que intervienen en la cola son todas las paredes y recovecos de la sala, convertidas en emisoras secundarias y terciarias que nos devuelven sonido desde todas las posiciones imaginables y en todas las direcciones que podamos concebir.
Desde esa perspectiva, mientras que el nivel de las primeras reflexiones tiene diferencias notables según dónde nos ubiquemos, el nivel de la cola difusa final es mucho más homogéneo en toda la sala. Al menos en salas amplias, mientras no nos coloquemos en un recoveco perdido o una confluencia de dos paredes.
Por así decirlo, la fila 3 y la fila 30 del patio de butacas reciben un mismo nivel absoluto de campo reverberante, aunque en la fila 3 el sonido directo es mucho más fuerte que la cola reverberante comparado con lo que se oye en la fila 30. No es la única diferencia. Como la cola reverberante es básicamente uniforme en todo el espacio, llega a la vez a ambos asientos, pero como el sonido directo es más tardío en la fila 30, 'parece' que la cola reberberante está algo más próxima al sonido directo. Son grados de libertad que en ocasiones pueden venir bien y que por eso aparecen como parámetros en las reverbs artificiales mínimamente complejas.
La cola reverberante es una amalgama de reflexiones tan abigarrada que a menudo su detalle interno importa poco. Por hacer una analogía, pensad en una manifestación. Todos vemos bien a los que la encabezan, los reconocemos y distinguimos hasta el punto de saber si llevan gafas o pendientes. Pero la muchedumbre que viene detrás es sólo una masa, un grupo, del que sólo podemos caracterizar aspectos globales y no individuales, como si vienen apelotonados o si son muchos o pocos, pero es imposible saber si tienen o no pendientes. Sólo sabremos decir algo sobre el pelo de esa masa si es una manifestación en favor del rubio de bote o bien en pro de orgullo de ser calvo, porque habrá un rasgo estadísticamente dominante en ese colectivo.
De forma semejante, aunque las ERs llevan mucha información útil sobre posicionamiento detallado, en la cola reverberante los detalles se difuminan y es poco importante la estructura fina interna, siendo perceptualmente relevantes sólo las 'tendencias' que apunta el grupo. Interesa la duración, cuánto tarda en extinguirse. Interesa también su color espectral y la variación de ese color a lo largo de la extinción de la cola. Pero, sinceramente, veo pocas veces justificado acudir para crear la cola a reverberación de convolución que implica detalle fino y requiere mucho cómputo para cosas que no vamos finalmente a percibir. De hecho la convolución fija con una respuesta impulsiva tomada en una sala acaba siendo algo estática, inmóvil, y muchas veces resultan más agradecidas las colas generadas con sistemas algorítmicos de buena calidad, en los que hay cierta modulación y cambio en el patrón interno de reverberación a lo largo del tiempo, capaz de dar algo más de vida al resultado. No pocas reverbs de convolución, de hecho, permiten animar las colas reintroduciendo algo de algoritmia y no obcecándose con el supuesto 'ideal' muestreado de un espacio real por magnífico que sea.
Si lo queréis aún más claro: mi preferencia para la mayor parte de los casos, tanto por cuestión de consumo de CPU como de resultados finales, pasa por usar varios patrones de ERs diferentes (que podrían generarse por convolución) para ubicar los instrumentos/pistas/grupos en lugares diferentes y una cola reverberante común y sin ERs aplicada en envío que sería algorítmica y de cierta calidad, capaz de evitar cualquier sensación 'cíclica' y que logre una buena sensación difusa. Regulación del retardo previo a cada juego de ERs, y un retardo antes de cada envío a la reverb de cola útiles para refinar y descongestionar cuando haga falta. Sin olvidar que pueda haber proyectos que necesiten otras estrategias porque busquen a propósito un sonido técnicamente más deficiente pero estilísticamente más adecuado.
Dicho lo cual, tampoco hay que complicarse siempre la vida tanto porque sí. Pero si en un proyecto con un diseño de reverb más sencillo (p.ej. una única reverb en envío para todo) empezáis a no obtener los resultados apetecidos, pensad en separar los instrumentos más críticos, y dadles su propio juego distintivo de ERs (probando varios hasta dar con el que más encaje, sin descartar no darles ninguno) y añadidles su cola reverberante con el mismo algoritmo que a las demás pistas pero en una instancia que tenga retiradas las ER que estéis aplicando para esa reverb general.

Relación sonido directo/sonido reflejado

Cómo de fuerte nos llega directamente la señal original al punto de escuchadepende de la distancia que nos separa de ella, pero no depende de la sala. Ni de sus dimensiones ni de sus materiales. Las paredes no influyen en la diferencia de nivel entre la señal que emana de la fuente y la que llega directa a nuestro oído. Es un rayo directo sin intervención de pared alguna, que sólo sufre el ‘desgaste’ de nivel y un mínimo de pérdida de agudos por el viaje a través del aire.
Pero en el resto del sonido que nos llega en las componentes reflejadas sí intervienen las paredes. Tal como hemos descrito, de forma diferentes en las ER y en la cola reverberante. Mientras las primeras reflexiones dependen mucho de la ubicación concreta, la cola reverberante es aproximadamente fija para cada sala estemos donde estemos. Por ello prefiero reverbs que ajusten separadamente el nivel de las ER y el de la cola reverberante. Es más, como apuntaba antes, prefiero generar las ERs y la cola separadamente, porque eso permite tratamiento diferenciado, quizá tratando la cola con algún tipo de compresión/expansión o side-chain para controlar su presencia relativa a la señal, o evitando la prolongación de las silibantes en la cola sin negarla en las ERs, etc.
Con todo, la diferencia entre el nivel de sonido directo y el nivel del efecto reverb ‘global’ es importante perceptualmente.
Sonido directo muy alto respecto al reflejado, da sensación de fuente cercana, de la que oímos mucho sonido directo temprano, mientras que el camino de ida y vuelta hasta las paredes reduce el nivel y retrasa la llegada de la reverberación. Sonido directo y reflejado con niveles cercanos hablan de mayor distancia, sensación que se refuerza disminuyendo el retardo entre el sonido directo y sus reflexiones. Y desde luego señal directa más débil que la reflejada (algo que sucede en los espacios naturales, no es sólo una posibilidad artificial) y sin apenas retardo que las separe sitúa la fuente muy, muy alejada, perdiéndose por el fondo del escenario virtual que narra nuestra mezcla.

Separación temporal con el sonido directo

Desde luego, son todos los parámetros los que intervienen y debería haber una correcta consistencia entre el ajuste de los niveles y el de los retardos de entrada de las ERs y la cola. Si las ERs tardan un tiempo amplio en aparecer, la sensación es de un gran volumen de sala, con paredes bien alejadas tanto del instrumento como del oyente/escucha. Sería atípico encontrar que la cola arranca antes de las ERs, completamente antinatural, pero el ajuste independiente de los tiempos para las ER y para la cola reverberante lo admite en algunos modelos de reverb artificial.
El ajuste individual del retardo pre-ERs y del pre-cola está pensado más para poder definir cuándo llegan las ERs (esa separación con el sonido original que decíamos) y cuánto tiempo van a estar estas ERs expuestas libres de la entrada de la cola. Aumentar el espacio que separa el inicio de las ERs y el inicio de la cola reverberante es algo que ayuda a sentir mejor, con más definición, el impacto de esas ERs y puede ser una forma de realzar la separación de las fuentes, su ubicación espacial en posiciones diferenciadas. Pero hay que vigilar que no retrasemos tanto la cola que se produzca una escisión demasiado artificial entre ambas fases del hecho reverberante que haga antinatural el resultado.

Parámetros importantes en la percepción de la reverberación

En definitiva algunas de las principales pistas para nuestro oído en la interpretación de la reverberación y que una unidad artificial debería considerar son:
- La relación sonido directo/sonido reflejado (mejor si podemos controlar individualmente nivel de ER y de cola reverberante) y la separación temporal directo/reverberación (de nuevo en sus dos frentes ER y cola) que nos informa de la cercanía de la fuente y nos puede dar más claridad en la sensación de ubicaciones diferentes.
- La mayor o menor presencia de ecos distintivos, esas primeras reflexionesdistinguibles frente a la reverberación difusa o borrosa de fondo y que portan una información valiosísima para definir el tipo de sala y la ubicación de fuente y escucha en relación a ella.
- La duración de la cola reverberante, llamada tiempo de reverberación (al que dedicaremos una entrega posterior), que nos da una una sensación global combinada sobre la viveza de la sala, si es de materiales absorbentes o al contrario muy reflectores
- La dependencia de la reverberación con la frecuencia, dado que el tiempo de reverberación no es el mismo para todas ellas, y que profundiza en las sensaciones sobre el tipo de material. Las losetas y otros materiales duros y planos reflejan por igual todas las frecuencias, mientras que los más habituales materiales son de tipo ‘paso bajo’ y hacen desaparecer más rápidamente las altas frecuencias en la cola reverberante. Muchas unidades de reverb artificial permiten combinar una acción 'paso bajo' con otra 'paso alto' para evitar un exceso de reverberación en el registro grave, que suele emborronar excesivamente la percepción.

Artículo publicado por Pablo Fernández-Cid en www.hispasonic.com
https://www.hispasonic.com/tutoriales/reverberacion-nociones-basicas-acustica-percepcion/42706

lunes, 20 de marzo de 2017

Grabación Reducción de ruido con Audacity: técnicas básicas

Grabación

Reducción de ruido: técnicas básicas con Audacity


Introducción
Siempre que grabamos hay ruido. Que sea imperceptible o no es otra cosa. Incluso siendo perceptible puede ser tolerable en según qué aplicaciones. Pero cuando una grabación ya realizada muestra un exceso de ruido molesto, no queda más remedio que pasarla por el quirófano de un editor de audio o DAW para aplicar reducción de ruido.
Diversos tipos de ruido contaminan las señales acústicas grabadas. Algunos de ellos tienen carácter de ruido de banda ancha (ruido blanco, hiss de cinta analógica, ruido de micrófono, rumble, ...), los hay tonales (hum -ruido de masa-), y otros son impulsivos (clicks, crackle, pops). Existen diversos equipos que tratan de eliminar el ruido (cuando se puede plantear un modelo de ruido que permita distinguirlo de la señal) o al menos de disminuir su efecto aparente aprovechando las características de percepción del oído.
Me centro en este tutorial en el clásico ruido de fondo estable y permanente que tiene causa ya sea en el equipo de grabación (cada vez menos) o la mayor parte de las ocasiones por presencia de alguna fuente de ruido en el lugar de grabación. Por ejemplo al grabar una locución en la misma sala en la que está el ordenador en el que estamos registrando, con sus ventiladores y discos duros girando, o sencillamente el ruido ambiente normal en una habitación o sala no acondicionada.
Nos interesaremos por los equipos 'single-ended' (o ‘ciegos’) que limpian de ruido una señal ya contaminada por él, asumen un cierto modelo del ruido y tratan directamente de aminorar su efecto, produciendo una señal más limpia. Un ejemplo evidente son los 'hum canceller', que se ocupan de eliminar el zumbido de red. Se trata de filtros notch sumamente estrechos sintonizados a 50 o 60 Hz. y alguno de sus armónicos. Los filtros digitales permiten una realización mucho más selectiva de estos filtros, mejorando los resultados, incluso con técnicas adaptativas capaces de seguir y compensar las variaciones que sufra ese hum.
Pero yendo a ruidos no tan localizados en frecuencias concretas, sino de banda más ancha, hay que seguir otras estrategias. A día de hoy suelen ser procesos en el dominio del espectro que usan alguna referencia del ruido y comparan con ella la señal grabada para decidir en cada momento y en cada frecuencia qué hacer: mantener la señal o rebajarla, en función de que esté más o menos contaminada. Pero para que todos lo entendamos mejor voy a hacer un recorrido previo por algunos antecedentes.
Una señal con ruido de fondo, y su detalle
hispasonic

Puertas de ruido y expansores ‘downward’

Las puertas de ruido (noise gate) son muy empleadas pero también muy invasivas. En ellas la energía local de la señal de entrada a lo largo del tiempo se compara con un cierto umbral, y cuando no lo alcanza se le aplica una ganancia cero, silenciando la salida. Cuando la energía de la señal sobrepasa el umbral, la ganancia que se aplica es 1, para dejarla pasar sin alteraciones. Esto permite que, cuando la señal tiene nivel suficiente como para que el ruido no se note en exceso, la señal no se modifique; pero si la señal baja de nivel y por tanto el ruido comienza a ser evidente se fuerza salida nula.
Los downward expander son menos bruscos en su acción sobre la dinámica y reducen el nivel tanto más cuánto más por debajo quede la señal de su umbral de actuación. Pero en el fondo tanto las puertas como estos expansores actúan como controles automáticos de ganancia que silencian los pasajes de poca energía, en los que el ruido es más notable.
No dejan de ser una variante de la acción sobre la dinámica que encontramos en los habituales compresores y limitadores, estos dedicados rebajar picos, mientras las puertas y los expansores downward hacen lo contrario: silenciar más si cabe los silencios.
Respuesta básica comparada de compresores, limitadores, expansores y puertas
pablofcid
Sobre esta idea inicial de las puertas y expansores hay varios refinamientos, como los clásicos ‘soft knee’ en la curva de respuesta a la dinámica para una acción más gradual, o la regulación de tiempos de ataque y de liberación en la actuación para adaptarse lo mejor posible a la propia ‘respiración’ de la señal.
En lugar de controlar la ganancia, otras variantes lo que hacen es controlar un filtro paso bajo, de forma que en vez de variar el nivel para toda la señal, a medida que el la señal baja de intensidad se ‘cierra’ ese filtro progresivamente para retirar las frecuencias agudas, que suelen ser las que más evidencian el ruido cuando la señal es baja (las señales de poco nivel suelen tener menor contenido en agudos y enmascaran peor el ruido en alta frecuencia).
Por citar dos ejemplos que fueron muy usados en su día, los modelos Drawmer DF320 y Symetrix 511A combinaban filtrado dinámico para limpiar el ruido de alta frecuencia con un downward expander que hace lo propio con las pausas y silencios (además cuentan con un filtro paso alto a 50 Hz, que elimina el zumbido de red). En ambos modelos, los efectos laterales a que este tratamiento compuesto (pérdida de agudos y brillo) da lugar son compensados mediante excitación psicoacústica y compresión sobre la señal limpia de ruido.

La cancelación de ruido con técnicas espectrales

Un refinamiento son las puertas y/o expansores que operan independientemente sobre distintas bandas. Con una puerta de un solo canal, si hay energía en baja frecuencia y ruido en alta, no se activará el cierre, con lo que el ruido se seguirá oyendo. Más todavía por estar ocupando una banda en la que no hay energía de la señal que lo enmascare. Combinando un banco de filtros con varias puertas simples, se puede crear una puerta de ruido o un expansor multibanda, capaz de tratar mejor el caso expuesto, por la atención individualizada a cada banda, tomando decisiones 'hay / no hay' señal en cada una.
Por volver a otro modelo antiguo pero en su día muy aplicado, podemos pensar en el Roland SN550, un eliminador de ruido mediante downward expander de 5 bandas para el ruido de banda ancha combinado con filtrado notch para el ruido de masa. La actuación diferenciada en cada banda suponía en el SN550 una evidente mejora y permitía tiempos de ataque y de release dependientes de cada banda.
De hecho la idea multibanda llevada al extremo desemboca en tratamientos espectrales, como los que encontramos en las actuales aplicaciones de reducción de ruido sencillas como la que incorpora Audacity, y también en otras más refinadas.
No se trata ya de montar un pequeño juego de bandas. La más potente actuación contra el ruido la proporcionan las estaciones de trabajo de audio digital y los plugin, en los que el banco de filtros (siempre limitado en número de canales) se convierte en unadescomposición espectral / FFT capaz de ofrecer centenares de ‘bandas’. Es lo habitual desde los sistemas de referencia especializados en eliminación de ruido como los de Cedar, a otros mucho más asequibles pero capaces de realizar un buen tratamiento en muchos casos como el efecto de reducción de ruido incluido en el editor gratuito Audacity.
Por continuar con referencias antiguas que fueron ampliamente usadas en su momento, Digidesign contaba con el plug-in DINR (Digidesign Intelligent Noise Reduction), que contenía dos módulos software, uno especializado en eliminar ruido de banda ancha, y el otro específico para eliminación de ruido tipo 'hum' (como el ruido de red, el de las pantallas y monitores de visualización, el de algunos equipos de iluminación, o el que captan las pastillas de las guitarras).
El reductor de ruido de banda ancha de DINR, en el fondo implementa un expansor multicanal de 512 bandas. Ciertamente por análisis espectral / FFT y no por un banco de filtros más tradicional, pero en el fondo son ideas equivalentes. Marcando con el ratónun segmento corto que contenga únicamente ruido en el fichero audio que se desea tratar, el sistema lo analiza, y con su espectro construye una máscara, una referencia de cómo es el ruido. En DINR el contorno del ruido es editable (p.ej. si se prefiere no tratar ciertas regiones del espectro para mantener su integridad libre de los posibles efectos laterales del procesamiento). Cuando ya se han definido el perfil deseado, el sistema analiza el fichero completo por segmentos y va comparando el espectro de la señal con la máscara del ruido.
Espectro de una señal con poco ruido, y el contorno espectral de este (en rojo)
pablofcid
En aquellas frecuencias en las que la señal no está claramente por encima de ese contorno umbral, se aplica una ganancia negativa (en un número de dB definible por el usuario). Otros parámetros ajustables son el tiempo de ataque y el de relajamiento (que impide parpadeo en el ruido de cada frecuencia), y el grado de suavizado general de la acción del reductor de ruido entre bandas consecutivas (para que al reducirse el ruido en unas bandas y en otras adyacentes no, no resulte un ruido de carácter tonal, concentrado en bandas estrechas, altamente molesto y fácil de percibir). Adicionalmente en DINR para compensar la posible pérdida de nivel en la señal final, la señal pasa por un filtro shelving ajustable por el usuario. Este filtro permite dar algo de ganancia a las frecuencias altas, y dado que actúa tras la reducción del ruido no incrementa simultáneamente el ruido que pudiera acompañarlas originalmente.
Esa descripción, con los retoques y mejoras que el tiempo y cada fabricante ha querido/sabido ofrecer, es aplicable a la mayoría de los sistemas de reducción de ruido que tenemos hoy en forma de plugin. De hecho si miramos el juego de parámetros del reductor de ruido de Audacity, no por casualidad recuerdan los que acabamos de comentar en DINR.
El reductor de ruido de Audacity y sus parámetros
hispasonic

El precio a pagar: ruidos tonales, flanging, ecos cortos...

Aunque mucho más precisos y eficaces que las actuaciones globales o sólo multibanda, los sistemas espectrales tienen sus propios 'peros' y habituarse a reconocerlos es importante. Los escucharéis en el vídeo de la próxima entrega. Hay que estar atentos especialmente al posible burbujeo espectral: tonos o silencios que entran/salen de forma intermitente por estar demasiado próximos al umbral. Son como mini silbidos, que quizá serían interesantes en una obra electroacústica de corte granular, pero que no lo son en nuestro contexto. Una componente débil que podía ser ligeramente molesta cuando estaba presente de forma permanente es un auténtico incordio insufrible cuando no para de activarse y desactivarse, haciéndose con ello más llamativa de lo que era en origen.
Otros problemas típicos son propios de cualquier tratamiento espectral: trabajan analizando el audio fragmento a fragmento y no de forma instantánea, y eso puede generar sensaciones de cierta especie de eco corto o breve reverberación.
Y otro síntoma típico de habernos excedido con el tratamiento será la presencia en el resultado de ocasionales sonoridades tipo ‘flanger/phasing/metalización’ que indican también que ha habido incisiones demasiado profundas con agujeros que se escuchan en el espectro y que van y vienen.
La parte más sensible para oír estos defectos son siempre las señales más impulsivas y la región de los medios hacia agudos. En el caso del habla, por ejemplo, las eses y las explosivas. Escuchándolas de forma más atenta que el resto podremos percibir mejor en qué grado del tratamiento comienzan a aparecer problemas ya serios. Tendremos ocasión de oír estas cuestiones en la próxima entrega. Afortunadamente son fáciles de reconocer una vez que desarrollamos la facultad de saberlas buscar con el oído atento. Y una vez que las detectamos podremos decidir qué es mejor: mantener una amplia reducción de ruido pese a esos artefactos sonoros o no ser tan exigentes y admitir una limpieza un poco más ligera pero a cambio con menos presencia de esos defectos sobre la señal resultante.
Qué es lo recomendable lo dicta cada caso, sus prioridades y el escenario en que nos movamos. No tiene nada que ver recuperar una locución ininteligible de un cassette almacenado durante 20 años, con sencillamente limpiar un poco una pista de un instrumento que va a formar finalmente parte de una mezcla multipista, o con intentar mejorar una sección de un tema en la que un instrumento está expuesto en solitario.


Consejos a la hora de grabar

Muchas veces nos llegan las grabaciones ya realizadas, pero si es una grabación que vais a registrar vosotros mismos, conviene recordar algunas cosas que luego vendrán bien si pensamos que vamos a necesitar aplicar reducción de ruido.
1) No usar auto ajuste de ganancia, ni ningún tipo de compresión al grabar. La compresión, si es necesaria en el resultado final, podría añadirse a posteriori, tras haber hecho la limpieza. Cualquier cuestión que modifique el contar con un nivel de ganancia fijo en toda la grabación dará lugar a subidas y bajadas del nivel de ruido y nos dificultará enormemente la tarea. Además hoy en día con 24 bits no nos importa tanto ajustarnos al máximo al recorrido posible, no hay que aprovechar ‘a fondo de escala’, tenemos holgura. Incluso en 16 bit, porque si estamos hablando de señales muy necesitadas de limpieza es fácil que estén alejadas de los 96dB de recorrido teórico de esos 16 bits.
2) Preferiblemente trabajar sin codificación perceptual, es decir grabar el audio sin compresión tipo MP3, etc. Cualquier procesamiento (y la eliminación de ruido lo es) trastoca las condiciones iniciales que usó el compresor y puede hacer sobresalir los ‘defectos’ introducidos por la codificación. Pensad que los codificadores perceptuales se basan en el enmascaramiento. Si quitamos un ruido intenso que inicialmente había, pueden dejar de estar enmascaradas cosas que preferiríamos no oír producto de la distorsión introducida por la codificación. Mejor no arriesgarse.
3) Trivial, pero a veces pecamos en esto. Al grabar tomad siempre la costumbre de dejar grabando unos segundos de supuesto ‘silencio’ (sólo ruido) tanto al comienzo como al final. No recortéis esos extremos para ahorrar tamaño de fichero, dejadlos ahí, que vienen bien. Insistid para que no haya voces, toses, movimiento de papeles, etc. cuando registréis el silencio. Y si podéis, durante el silencio inicial incluid algún chasquido impulsivo (dedos, palma, boli sobre mesa…). El silencio del principio dara una buena señal de referencia para que el programa pueda obtener el perfil de ruido. El silencio del final permitirá comprobar si el ruido es o no estable de principio a fin de la grabación. Y los chasquidos al comienzo facilitan enormemente detectar cuándo los ajustes de los parámetros de reducción de ruido empiezan a maltratar de forma apreciable la señal. Poder tener esa señal ‘testigo’ en el comienzo de la toma es una bendición.

Consejos antes de empezar el tratamiento

Ya tenemos el fichero. Nos lo han enviado si es un encargo o lo acabamos de cargar en nuestro editor/DAW si es grabación nuestra.
4) Primero un vistazo general al fichero. Mirad si realmente la toma es única o hay varias tomas. No pocas veces se trata de un collage en el que han grabado haciendo ‘pause’ y entre medias moviendo la posición de la fuente o del micro, etc. Si parece que hay varias tomas, cada una puede tener un nivel y un perfil de ruido diferente y es mejor tratarlas por separado. Mirando sencillamente el nivel del ruido en la forma de onda durante las pausas que haya intercaladas en la grabación tenéis una primera idea de si más o menor permanece sin mucho cambio.
5) Escuchar si el ruido es estable en toda la grabación o si hay cambio de nivel o de color. Si hay cambios, de nuevo, es mejor plantear un tratamiento por fragmentos y no de una única vez.
6) Trivial, pero esencial: aseguraos de trabajar sobre una copia del original, no trabajéis directamente sobre él. Es normal que, especialmente las primeras veces, os llame la atención la reducción de ruido y la hagáis excesiva, con problemas que una segunda escucha desvelará. Poder volver al original es una garantía. Ojito, que Audacity permite editar directamente el original y si por un descuido conserváis la versión editada no habrá quien vuelva atrás. No toméis riesgos innecesarios.

Consejos al realizar el tratamiento

7) Lo primero es localizar un fragmento de audio útil para la extracción de la semilla de ruido. Las pausas son momentos ideales, pero hay que escuchar conatención a posibles ruidos y clics que se cuelen y que deformen la estimación de ruido dando entrada a cosas que no son parte de él. En el vídeo lo veis en la práctica.
8) Un fragmento largo será útil para mejorar la precisión de la estimación de ruido… siempre que no contenga clics ni otros componentes o interferencias de fondo. Si hay esas interferencias, es preferible muchas veces un fragmento breve.
9) La reducción de ruido suele consumir cierto tiempo. Por ello, el software acostumbra a ofrecer una ‘vista previa’ que trata sólo un fragmento del comienzo del fichero o del fragmento seleccionado. Escuchad siempre la aplicación de la limpieza con la opción de ‘evaluación previa’ y os dará una idea de qué éxito tendrá. Sobre todo permitirá ajustar los parámetros hasta dar con una combinación adecuada antes de acometer la reducción sobre el fichero completo.
10) Ajuste de los parámetros: la regla es siempre, cuanto menos se intervenga mejor. Hay que reducir ‘algo’ de ruido, no pretender ‘eliminarlo’. Al eliminar mucho ruido eliminaremos también algo de señal y el resultado empeora. Un sonido más natural y con menos evidencias de haber sido tratado es factible si nos permitimos dejar el ruido a un nivel poco perceptible, no empeñándonos en un silencio total en las pausas. Podréis oír en el vídeo varios de los defectos que aparecen si nos excedemos.
Y el último y más obvio, pero a veces con las prisas pasado por alto:

11) Siempre escuchad el resultado, aunque la ‘vista previa’ pareciera buena, y buscar los posibles artefactos que haya causado el procesamiento. Hay que estar atentos especialmente al posible burbujeo espectral con tonos/silencios que entran/salen, así como efectos tipo ‘flanger/metalización’ y sensaciones de eco corto/reverberación. Siempre centrando la escucha en las partes más sensibles: la región medios-agudos y sobre todo las componentes más impulsivas. Si globalmente está bien pero hay algún momento con fallos más críticos, plantearos fragmentar y hacer un tratamiento aparte, con menos reducción, en esas zonas.

Artículo publicado por Pablo Fernández-Cid en www.hispasonic.com
https://www.hispasonic.com/tutoriales/reduccion-ruido-audacity-tecnicas-basicas/42749