Tras el análisis que hemos llevado a cabo en anteriores entregas sobre las diferentes estrategias posibles para aplicar algoritmos de reducción de ruido altamente eficientes a las imágenes captadas con cámaras de cinematografía digital, una pregunta destaca sobre las demás: ¿Cuál es el mejor dominio para la reducción de ruido con un algoritmo puntero? ¿Es el lineal, el logarítmico o el correspondiente a la visualización en pantallas?

Una de las imágenes de prueba que se utilizan en el método BM3D es esta vista cenital del edificio del Pentágono.
Una de las imágenes de prueba que se utilizan en el método BM3D es esta vista cenital del edificio del Pentágono.

Así como podemos esperar que el procedimiento funcione bien en un dominio de datos cercano a la percepción humana, también es predecible un buen funcionamiento si empleamos otro con características de ruido bien conocidas y delimitadas. No obstante, ambos objetivos no pueden alcanzarse por completo a la misma vez. Es necesario encontrar un equilibrio entre los dos requerimientos. Para responder a la pregunta es imprescindible –en consecuencia– aplicar los métodos BM3D y BLS-GSM al dominio lineal.

Conjunto de imágenes de prueba del método BLS-GSM
Conjunto de imágenes de prueba del método BLS-GSM

El método BM3D alcanza una PSNR mayor en el dominio de la visualización en pantallas, tanto en lo que respecta a los datos RGB que contienen ruido no correlacionado como en lo que respecta a los datos del debayerizado. En el caso del BLS-GSM, se alcanza una PSNR superior en en el dominio lineal en RGB, pero dicha PSNR es aún más elevada para la reducción de ruido en el dominio de la visualización en pantallas a partir de los datos del debayerizado. Por lo tanto, no es posible obtener una respuesta clara basándose sólo en esta información.

Resultados comparativos entre los métodos BM3D y BLS-GSM.
Resultados comparativos entre los métodos BM3D y BLS-GSM.

Los resultados que ya presentamos en nuestro anterior artículo de esta serie –a partir de dos algoritmos de nueva hornada aplicados a la imagen de la ciudad simulada por ordenador– nos permiten asegurar que los valores finales pueden depender tanto del método como del dominio de reducción de ruido. Por tal motivo es obligatorio debatir más métodos distintos.

Métodos de reducción de ruido

Los métodos de reducción de ruido se pueden clasificar en métodos de dominio del píxel y métodos del dominio de la transformada. Los primeros abarcan desde los sistemas de filtrado adyacente más básicos –como el filtrado gaussiano local– a los más potentes, basados en la autosimilaridad. El más conocido de entre los basados en dicha autosimilitud es el algoritmo de medios no locales. También podemos considerar a los métodos variacionales como métodos del dominio del píxel. El ejemplo más conocido sería el de variación total.

Conjunto de imágenes de prueba para comparar diferentes métodos de reducción de ruido.
Conjunto de imágenes de prueba para comparar diferentes métodos de reducción de ruido.

Los métodos del dominio de la transformada difieren en particular en sus sistema de descomposición. De entre ellos, los relativos a la transformada de Fourier no resultan adecuados para la reducción de ruido, ya que no proporcionan ninguna clase de información local en los coeficientes. Este problema se resuelve o bien usando una transformada de coseno discreta (DCT) en una ventana local, o bien usando transformaciones de ondícula (wavelet), que proporcionan información tanto espacial como de frecuencia.

El triángulo de Sierpiński es un fractal que se puede construir a partir de cualquier triángulo y un ejemplo clásico de autosimilaridad.
El triángulo de Sierpiński es un fractal que se puede construir a partir de cualquier triángulo y un ejemplo clásico de autosimilaridad.

A día de hoy, las soluciones más exitosas se basan en las ventajas de ambos dominios: el de la transformada y el del pixel. El método BM3D, por ejemplo, explota la idea de la autosimilaridad en el dominio del pixel y luego aplica un filtrado del dominio de la transformada de coseno discreta. Como hemos mencionado anteriormente, la cantidad actual de algoritmos de reducción de ruido es demasiado numerosa para analizar cada uno de ellos en estos artículos, pero a partir de los más representativos podemos alcanzar conclusiones provechosas.

Percepción del ruido

Antes de enumerar una serie de conclusiones sobre los algoritmos de reducción de ruido más eficientes o sus combinaciones más afortunadas, debemos abordar el tema de la visibilidad del ruido espacio-temporal por parte del ser humano. El ruido es un efecto inevitable en cualquier secuencia de vídeo filmada en el mundo real. Afecta seriamente a la calidad visual de sus contenidos, en especial en condiciones de iluminación pobre o escasa. Teniendo en cuenta que la mayoría de los sensores actuales sacrifican el tamaño de los píxeles en favor de una mayor resolución, la necesidad de soluciones algorítmicas se ha incrementado sobremanera.

Algunos fabricantes han optado por incrementar el formato y tamaño de sus sensores a la hora de aumentar la resolución de los mismos, para evitar que el tamaño de los fotodiodos de sus píxeles se reduzca en exceso. En la imagen, senor de una ALEXA LF de gran formato en la que ARRI ha mantenido idéntico tamaño de los fotodiodos (8,25 micrones) que en sus sensores de S35.
Algunos fabricantes han optado por incrementar el formato y tamaño de sus sensores a la hora de aumentar la resolución de estos, para evitar que el tamaño de los fotodiodos de sus píxeles se reduzca en exceso. En la imagen, sensor de una ALEXA LF de gran formato en la que ARRI ha mantenido idéntico tamaño de los fotodiodos (8,25 micrones) que en sus sensores de S35.

El propósito de esta serie de artículos es el estudio –a nivel muy elemental– de la visibilidad del ruido. Ninguno de los métodos de reducción que hemos mencionado es capaz de reconstruir la imagen real. Siempre existe un error de cálculo de mayor o menor calado. El desafío al que se enfrentan los ingenieros es el de ocultar las consecuencias de ese error de cálculo tan bien como sea posible. Hemos podido observar que dicho error es particularmente severo cuando se aplican métodos espaciales de reducción de ruido en la imagen a los datos de vídeo. En estos casos, el error consiste en un ruido de frecuencia muy bajo.

En una imagen fija, semejante ruido es casi invisible –como consecuencia de la disminución de la sensibilidad al contraste de la visión humana en frecuencias espaciales muy bajas. Pero si esas imágenes forman parte de una secuencia de vídeo, el ruido de baja frecuencia reaparece en forma de parpadeo y resulta muy molesto de cara a la experiencia del visionado. Como resulta muy difícil separar el ruido en las bandas de baja frecuencia del contenido real de la imagen, todavía constituye un problema de calidad crucial en los procesos de reducción de ruido para vídeo.

En esta imagen, la amplitud del contraste se muestra exclusivamente en la coordenada vertical, mientras que la frecuencia espacial se muestra en la coordenada horizontal. Para que nuestra visión detecte la fluctuación sinoidal, necesita menos contaste en la frecuencia media que en la alta.
En esta imagen, la amplitud del contraste se muestra exclusivamente en la coordenada vertical, mientras que la frecuencia espacial se muestra en la coordenada horizontal. Para que nuestra visión detecte la fluctuación sinusoidal, necesita menos contraste en la frecuencia media que en la alta.

A pesar de que los métodos de reducción de ruido temporales pueden reducir mejor el parpadeo, también pueden introducir nuevos artefactos –sobre todo de movimiento– e implican un alto coste computacional. Sus requerimientos de memoria resultan extremadamente altos con resoluciones de 4K y superiores. Por desgracia, aún no existen estudios exhaustivos que proporcionen detalles sobre la visibilidad del ruido en secuencias de vídeo dependiendo de su distribución espectral. Stefan Winkler y Sabine Süsstrunk presentaron en su día un estudio subjetivo examinando la visibilidad del ruido en imágenes fijas. Además del ruido blanco, también utilizaron ruido de media y alta frecuencia. Los resultados muestran una visibilidad menor en el caso del ruido de alta frecuencia cuando se compara con el de media frecuencia. Esta conclusión era de esperar a causa de la función de sensibilidad al contraste. En principio, cabría esperar un fenómeno parecido si se comparara el ruido de alta y media frecuencia con el de baja frecuencia, pero este último no fue objeto del estudio.

La naturaleza aleatoria del grano presente en las emulsiones de una película influye en nuestra percecpción. El cerebro tiende a ignorar más dicho grano que el ruido electrónico que presenta la captación digital, como consecuencia de la constante búsqueda de patrones que realiza (y que es capaz de encontrar en la trama de un sensor). Incluso en un film extremadamente "sucio" como "Taxi Driver" (Martin Scorsese, 1976), la fotografía de Michael Chapman no sólo no resulta molesta al espectador sino que aaprovecha ese fenómeno para adquirir una textura que consigue evocar la atmósfera de la ciudad desde el punto de vista de su protagonista y que ya no podemos disociar de la imagen mental que tenemos de la Nueva York de mediados de los 70.La naturaleza aleatoria del grano presente en las emulsiones de una película influye en nuestra percecpción. El cerebro tiende a ignorar más dicho grano que el ruido electrónico que presenta la captación digital, como consecuencia de la constante búsqueda de patrones que realiza (y que es capaz de encontrar en la trama de un sensor). Incluso en un film extremadamente "sucio" como "Taxi Driver" (Martin Scorsese, 1976), la fotografía de Michael Chapman no sólo no resulta molesta al espectador sino que aaprovecha ese fenómeno para adquirir una textura que consigue evocar la atmósfera de la ciudad desde el punto de vista de su protagonista.
La naturaleza aleatoria del grano presente en las emulsiones de una película influye en nuestra percepción. El cerebro tiende a ignorar más dicho grano que el ruido electrónico que presenta la captación digital, como consecuencia de la constante búsqueda de patrones que realiza (y que es capaz de encontrar en la trama de un sensor). Incluso en un film extremadamente “sucio” como “Taxi Driver” (Martin Scorsese, 1976), la fotografía de Michael Chapman no sólo no resulta molesta al espectador sino que aprovecha ese fenómeno para adquirir una textura que consigue evocar la atmósfera de la ciudad desde el punto de vista de su protagonista y que ya no podemos disociar de la imagen mental que tenemos de la Nueva York de mediados de los 70.

En nuestra próxima entrega, analizaremos la visibilidad del ruido para ocho bandas de frecuencia distintas. La evaluaremos tanto en ruido estático –como ocurre con las imágenes fijas– como en ruido dinámico –que es el que aparece en los datos de vídeo–.

Dejar una respuesta

¡Por favor, introduce tu comentario!
Por favor, introduce aquí tu nombre

Los comentarios en esta página pueden ser moderados; en tal caso no aparecerán inmediatamente al ser enviados. Las descalificaciones personales y los comentarios inapropiados que no tengan que ver con el tema a tratar serán eliminados.