│♦ Fundamentos│► Abordamos hoy un tema crítico, por un lado la tecnología nos acompaña potencialmente para poder trabajar grabaciones super realistas, sin embargo cada día que pasa, parece que las cosas suenan peor. ¿Donde están esas sorpresas de Queen, los Fortísimos de la Septima Sinfonía de Beethoven y los bajos «matadores» de los timbales de «Así habló Zaratustra»?
Una pequeña introducción
Esta breve oración que estoy escribiendo ahora, carece de variaciones de amplitud importantes…
¡Sin embargo, esta segunda frase que leen tus OJOS, tiene un importaNTE rango dináMICO!
De «eso» se trata precisamente el tema de hoy. De las variaciones de amplitud. De las diferencias entre suaves y fortísimos, de la sorpresa, de la intensidad sonora. Todos estos aspectos no son solamente técnicos, también son decisiones estéticas y forman parte de un concepto a veces bastante descuidado. Conozco muchísimos usuarios que son capaces de gastarse U$S 1200 en una placa de sonido de 24 bits, pero usan micrófonos de U$S 120… Semejante despropósito, genera entre otras cosas, la redacción de este artículo.
Fundamentos de la amplitud del sonido:
Solo para ponernos en tema, repasemos algunos conceptos básicos de la física del sonido. Básicamente el sonido se produce por diminutos cambios en la presión atmosférica (Oscilación o pulsación), provocados por un cuerpo elástico, que se ha puesto en vibración. Dichos cambios, se transfieren en una reacción en cadena, que llega a las inmediaciones de nuestro oído externo, provocando el movimiento de los tímpanos (y su consecuente cadena de huesecillos) que baten dentro de la Cóclea (una especie de caracol lleno de líquido y pelillos). Esas vibraciones dentro del líquido del oído interno hacen mover los pelillos (cilios cocleares) que producen un impulso eléctrico (Órgano de Corti) que viaja al cerebro por el nervio auditivo y provoca la SENSACIÓN SONORA. Las dos variables que provocan este fenómeno sonoro (y todos los fenómenos sonoros) tienen que ver con la AMPLITUD del movimiento oscilatorio y el TIEMPO.
Algunos podrían pensar que la mayoría de lo que escuchamos en un estudio en un sintetizador, que produce todo el sonido de manera digital o eléctricamente. En realidad, es un error. Quien produce la sensación sonora es el ALTAVOZ. Ya que éste es el verdadero cuerpo elástico que produce las vibraciones (dado que es una membrana que oscila a partir de impulsos eléctricos) provocando micro cambios de presión en el aire que nos rodea y generando esa SENSACIÓN de sonido.
Si pudiéramos colocar un lápiz en la punta del altavoz y hacer correr un papel por delante de él, obtendríamos una imagen que gráfica los cambios de presión sonora a lo largo del tiempo. En concreto este aparato se llama OSCILOSCOPIO. En realidad no se trata de medir movimientos actualmente, sino diferencias de potencial eléctrico. Lo que sigue es un gráfico que representa dichas variaciones:
De dicho gráfico se desprenden varios conceptos importantes para la música en general y para que entendamos las cuestiones de NIVELES DE SONORIDAD en los teclados:
- Llamamos piso de ruido (NOISE FLOOR) al nivel de amplitud del ruido de fondo. Que todo sistema acústico, eléctrico o digital posee. Cualquier señal debe despegarse del piso de ruido para ser escuchada. Cuanto más se despega, mejor resulta.
- Rango dinámico: El rango dinámico es la distancia entre el silencio y el sonido más fuerte en amplitud que el sistema tolera. Desde el piso (silencio) hasta el Techo (HEAD ROOM). Se mide en dB. (Los decibelios son una medida comparativa de la amplitud, no una medida absoluta) Cuanto más amplio es este número mejor resulta. El oído humano posee un rango dinámico que va desde el 0 dB SPL (Sound pressure Level) hasta, los 140 dB SPL, que es el límite que tolera el tímpano. En realidad el umbral del dolor está entre los 120 dB y 130 dB de Presión sonora (SPL). Sin embargo el oído tiene un mecanismo de protección que hace que pueda retraer la contracción del tímpano para poder absorber una intensidad mayor inesperada, pero no debemos abusar de ese seguro, porque a la larga trae consecuencias irremediables en la pérdida de audición.
- Relación Señal Ruido: Se define esta relación (SIGNAL TO NOISE RATIO) como la diferencia que haya entre el rango dinámico posible y el piso de ruido. Cualquier aplicación de buena fidelidad de audio, la SNR (relación señal ruido) no debe estar por debajo de los 90 dB de diferencia.
- Picos y Valles de la señal: Son los momentos de máxima amplitud y mínima que se suceden a lo largo del tiempo en una señal sonora. Si la amplitud es demasiado fuerte, básicamente se golpeará la cabeza contra el techo (HEADROOM) provocando una DISTORSIÓN POR AMPLITUD (a veces llamada saturación). Si es demasiado baja, no podrá sobreponerse al piso de ruido (NOISE FLOOR).
¿Que és entonces el rango dinámico?
El oído humano, puede en teoría ser capaz de escuchar sonidos tan leves como 14 dB/Spl y tolerar otros tan fuertes como de 140 dB/Spl. En 0 dB/Spl, encontraríamos el umbral del silencio. Ahora bien, todos los sistemas portan siempre algo de señal no deseada: RUIDO. Incluyendo el estudio mejor insonorizado del mundo, tiene ruido. Cuando entramos al estudio y escuchamos la circulación de la sangre en nuestros oídos, ya tenemos algo de señal no deseada. Ese umbral de ruido existente (NOISE FLOOR) es inevitable. Si estamos en una habitación común podremos escuchar con facilidad una serie de sonidos no deseados que constituyen nuestro piso de ruido.
Cualquier sonido que queramos percibir con atención, deberá tener una intensidad tal, que se imponga por sobre el NOISE FLOOR existente de tal modo que se despegue en amplitud del mismo, pero sin exceder el límite del sistema. (Headroom)
Imaginemos que nuestra habitación tiene un ruido ambiente de 20 db/spl. Para poder escuchar alguna señal deseada, la misma deberá elevarse por encima de esa intensidad. No elevarse demasiado al punto que nos rompa los tímpanos (160 dB/spl). Ya que ese es nuestro techo. Lo mismo ocurre con los sistemas eléctricos y electrónicos. Ya sean analógicos o digitales. Tenemos siempre un piso de ruido y un pico máximo tolerable (peak level). Las señales sonoras usualmente se comportan dentro de una amplitud promedio, es decir la mayor parte del tiempo, están moviéndose en una intensidad que llamaremos «average», o intensidad nominal. En los equipos de Hi Fi suele llamarse RMS. Todo sistema admite una amplitud (o potencia) nominal específica y tolera algunos picos (peaks). Por encima de esos picos, el sistema se daña. Ese punto se llama HEADROOM, o techo dinámico.
Definimos entonces RANGO DINAMICO ÚTIL: Como la diferencia de amplitud (medida en dB) entre el pico máximo posible y el umbral de ruido.
La RELACION SEÑAL RUIDO es entonces, la diferencia entre el PISO DE RUIDO y el PROMEDIO (Average) de la señal sonora utilizada dentro del margen del Rango dinámico posible.
Un ejemplo del mundo real
Imaginemos estar en un cuarto pequeño escuchando de cerca un grupo de 3 instrumentos tocando todos ellos a muy fuerte volumen:
La sensación auditiva en esa habitación será tolerable y probablemente agradable, la suma de los volúmenes individuales de los instrumentos, llena nuestras expectativas sonoras, alcanzando los 110 dB SPL, con lo cual escucharemos fuerte y claramente cada instrumento.
Imaginemos en la MISMA HABITACION, la suma de varios instrumentos del mismo tipo y algunos nuevos:
Forzosamente estaremos llegando al límite de tolerancia de volumen de nuestros oídos. Estaremos sobrepasando la capacidad auditiva y rozando el límite del dolor. (Lo que eléctricamente llamaríamos Distorsión por amplitud)
La manera de evitar este problema sin dejar que los instrumentos sigan tocando fuerte es: Pedir que los instrumentos toquen mas suave (alterar las dinámicas individuales) ó tomar distancia de las sumatoria de fuentes sonoras (alejarse)
Y eso hará que podamos escuchar más instrumentos, pero claro, ahora sí, la sensación de volumen general del grupo es la misma, pero el volumen parcial de cada uno de ellos, ha bajado en su individualidad. Esto es lo que ocurre cuando sumamos más pistas de audio a una grabación, o más voces de polifonía o más instrumentos simultáneos a nuestro sintetizador y observamos que la sumatoria de esas señales no sobrepase el techo dinámico (headroom) de nuestro sistema.
Una analogía que nos ayudará a comprender el problema
Una vez que establecimos los principios básicos del rango dinámico, estamos en condiciones de comprender cuál es el dilema al que se enfrenta un ingeniero de mezcla, un diseñador de un instrumento electrónico, un ingeniero de masteirng, al lidiar con el tema de los niveles.
Imaginemos por un momento que representamos al RANGO DINAMICO de un sistema, como la capacidad que tiene un jarro de vidrio de llenarse con agua. ¿Cuál es la capacidad que tiene nuestro sistema para provocar una SENSACIÓN DE VOLUMEN SONORO, sin caer en el error de una DISTORSIÓN POR AMPLITUD?
Para el caso en cuestión, dicha capacidad debe observarse a través de todos los subsitemas, desde el micrófono, el conversor analógico digital, el DSP, la consola de mezclas, los altavoces, la sala de escucha, y finalmente nuestros oídos.
Primero que nada hagamos un pequeño experimento en nuestro laboratorio de la mente. Imáginemos que el sonido puede tener una analogía con la cantidad de agua. Tenemos vasos con agua. Y una Jarra para ir llenando a medida que envíamos el agua de los vasos al interior del recipiente. Imaginemos que la capacidad máxima de nuestro jarro, en lugar de medirla en centímetros cúbicos, la medimos en decibelios. Y que la misma es de 120 dB. Y en nuestra mesa podríamos de disponer de diez vasos para llenarlo. Cada vaso está lleno con 12 dB. Si procedemos a verter el contenido de cada vaso, en el jarro, el jarro contendrá perfectamente el total de los líquidos ofrecidos por los vasos. Si en cambio tenemos 20 vasos en la mesa y pretendemos usarlos llenos hasta el tope con líquido, cuando lleguemos a volcar el vaso número once en el jarro, lo habremos desbordado. Por esa razón, los vasos deben ser llenados hasta unos 6dB cada uno. Así si vertemos los veinte dentro del recipiente de destino, este no se SATURARÁ de líquido y podrá contenerlos a todos. Los números que usamos son arbitrarios y simples para que se entienda el concepto.
En principio la solución parece simple. Llenar menos los vasos si tengo más vasos. ¡Pero no lo es.! La sitiación descripta en la inforgrafía anterior sirve para comprender el concepto. Dicho concepto se basa en que son ondas sinusoidales, simples, que permanecen constantes en cada vaso en su nivel de amplitud. ¡En la vida real, todo eso cambia drásticamente y tendremos que ser verdaderos marineros expertos de las dinámicas para movernos en semejantes tormentas de sonoridad!
¡Pero el agua de los vasos tiene marejadas de niveles!
En el mundo real, el agua en los vasos, mas bien parece una tormenta marina, en donde los niveles de las olas suben y bajan permanentemente. En primer lugar, si pensamos en una producción de audio multipistas, cada uno de los tracks tendrá un señal de amplitud diferente que irá variando en función de la expresión musical, a veces voluntariamente, o a veces por error de interpretación.Si se trata de estar escribiendo un arreglo o dirigiendo una orquesta sinfónica, las variaciones de intensidad sonora, son de hecho un recurso expresivo ineludible. Si estamos diseñando sonidos para un sampler o un sintetizador, cada una de las demandas de sonido generadas por una orden de control (pulsar un tecla, subir un pedal de expresión, etc.) estár influenciando el resultado final, y es en sí misma una señal variable en amplitud. Si lo miramos incluso en la micro escala de lo que implica el significado de Frecuencia (lo agudo o grave del sonido), veremos que realmente lo que define esa característica son cambios en la amplitud del movimiento del cuerpo vibratorio que generan ciclos de movimientos (Ciclos por segundo, o tambien llamados Hertzios). Por lo tanto el tema de como manejar las amplitudes para poder no salirse del rango dinámico y aún asi lograr sobrepasar el nivel de ruido (noise florr), es de radical importancia.
Si nos pasamos del rango dinámico no ocurre que el sonido se saldrá del jarro. Sinó que se enfrentará a la limitación del headroom y la onda resultante será distorsionada y aplanada. Creando un efecto llamado distorsión por saturación. Que en algunas situaciones de mezcla puede hasta llegar a ser un efecto deseado. (Caso concreto la guitarra eléctrica, por ejemplo). Las señales, los músicos, los interpretes, producen variaciones de rango dinámico. Sino, sería sumamente aburrido tocar un instrumento siempre con la misma cantidad de intensidad sonora. Es trabajo nuestro poder tener controladas esas señales. Si lo hacemos bien, tendremos un resultado altamente satisfactorio, si lo hacemos mal, estaremos matando la magia del sonido. Veamos algunos ejemplos de grabaciones y gráficos de dinámicas legendarios para que a tu juicio puedas entender con los oídos de que estamos hablando.
► El primer video con la subsiguiente imagen de intensidades es del segundo movimiento de la sinfonía n°2 de Ludwig Van Beethoven, en versión de la filarmónica de Londres, dirigida por Simon Rattle. Te invitamos a seguir la escucha al mismo tiempo que observas el gráfico que hemos creado, para que saques tus propias conclusiones acerca del Rango Dinámico. ▼
► El segundo ejemplo es un clásico del Rock. Bohemian Rhapsody, interpretada por Queen, Obviamente hace un uso importante del nivel promedio de la amplitud, pero aún así conserva sorpresa dinámica. Tiene momentos de más potencia y momentos de mayor intimidad dinámica. ▼
► El tercer ejemplo es un hit del momento a la hora de escribir este artículo. Se trata de un tema muy comercial. Como verás, todo el tiempo todo esta muy fuerte!. ( el inicio de la parte teatral no ha sido pasado por el análisis de intensidad, así que presta atención cuando la parte musical inicia) No vayas a pensar que es simplemente una cuestión de vender más. El tema anterior de Queen es uno de los más grandes Hits de la historia, y no tiene las dinámicas todo el tiempo en el mismo nivel. ▼
De la observación de los tres ejemplos que acabamos de mostrarte, surgen algunas observaciones interesantes.
- El manejo y aprovechamiento del rango dinámico es completamente diferente en todos los ejemplos. El primer ejemplo presenta muchas mas variaciones en cuanto al uso del rango dinámico que el último.
- En todos los casos, curiosamente o no, el pico de máximo de amplitud esta alrededor el 75% del tiempo transcurrido. No te sorprendas demasiado. Es un recurso estético durante el manejo del drama de tensión y distensión que los compositores o productores, ponga su punto de climax alrededor del 75% de la obra. En este caso eso está logrado por la intensidad, pero también se puede lograr con muchísimos otros elementos expresivos.
- Si realizas únicamente una inspección visiual te darás cuenta que como objeto estético (sabemos que poco importa el dibujo de la resultante de ondas de una obra) hasta parace generár más interés el que tiene mas variaciones. El tercer ejemplo es predecible en toda su gama de colores, los otros nó. Eso es uno de los factores que hemos perdido al no manejar la SORPRESA de intensidades como concepto en la obra.
La realidad perdida
Si todavía cuando pasamos por un local y podemos darnos cuenta de que hay una banda en vivo ensayando y no se trata de una grabación de un ensayo, es debido a dos razones fundamentales: Por una parte, los frentes de onda, por la otra, el rango dinámico. Ninguna máquina posee tal mecanismo de precisión como lo tiene nuestro aparato auditivo… Por lo tanto, en el proceso de grabación, siempre perdemos algo. El riesgo mayor se encuentra en la etapa de «toma» del sonido, y tiene que ver con los micrófonos. Como casi ningún micrófono posee un rango dinámico de 140 dB (independientemente de su respuesta en frecuencias), necesitamos toda una batería de ellos para poder fabricar entre todos, un «oido artificial», que sí pueda abarcar un rango dinámico mayor. Esta capacidad de los mics de lidiar con rangos dinámicos amplios, tiene que ver en gran medida con la superficie de sus membranas. Es por eso que los micrófonos de estudio, suelen ser micrófonos de membrana y cápsula amplia. En directo, las cosas se complicarán un poco mas y ya no podremos usar estos mics, por los riesgos de acople que implican. Ahora bien, si después de invertir una fortuna en micrófonos, resulta que nuestra cadena de audio tiene eslabones débiles que no poseen un rango dinámico adecuado, estamos realmente en problemas…
Con respecto a los frentes de onda abarcaremos ese tópico en otro artículo. Pero básicamente tiene que ver con la distribución en el espacio de las variaciones de presión sonora. Imagina un bombo de una batería. Tiene una membrana por lo menos de 18″. Que impulsa cambios en la presión sonora. Las frecuencias de ese sonido rondan entre 40 Hz y 100 Hz (sin contar el ruido del golpe de la maza en el parche). ¿Tu crees que aunque tu altavoz de 8″ tenga un rango de frecuencias entre 20 Hz y 22 kHz, pueda expresar la frecuencia, será capaz de crear en el espacio ese globo gigantesco de presiones y rarefacciones que crea una membrana de 18″? . La respuesta es un absoluto NO.
Bueno ya entendimos, ahora bien, ¿Cómo lo soluciono?
El aprovechamiento del rango dinámico es un proceso que se atiende desde el nacimiento (toma del sonido) hasta el final (la llegada al oyente de la resultante de audio) Hay muchas soluciones y estrategias posibles para cada instancia del proceso. Obviamente muchos de ustedes están pensando en el uso de algún tipo de efecto como un compresor o un limitador, ya sea en los inserts de las señales o en el master final. En el próximo episodio de este artículo, abordaremos todas esas alternativas, por ahora les pedimos: ¡coraje marineros! y a lanzarse a las aguas turbulentas de la segunda parte de este artículo haciendo click en el link que dejamos aqui debajo. Eso es todo por ahora… y ¡Ahoi! ¡Ahoi!
https://audiomidilab.com/rango-dinamico-en-busca-de-la-realidad-perdida-2-mares-de-tormenta/
► Como BONUS, te dejamos esta maravillosa animación sobre el segundo movimiento de la sinfonía n°2 de Ludwig Van Beethoven, !!! Si observas atentamente aprenderás muchísimo de ella!!!▼
► Salvando las distancias, te dejamos esta CURIOSA VERSIÓN interpretada por MOST (MIDI ORCHESTRAL SINPHONYC TEAM) La orquesta de alumnos de AUDIOMIDILAB en 1997. Hecha con una instalación de sonido 30.1. Tomado el audio con una cabeza holofónica, e interpretada COMPLETAMENTE POR ALUMNOS AMATEURS y SINTETIZADORES CON SAMPLES y DISEÑO DE SONIDO PROPIO!!! ▼
Y para terminar este maravilloso desafío les dejamos el consejo de un ingeniero que es una bestia mítica del manejo del estudio de grabación: