Mientras que en nuestra anterior entrega describimos la influencia del debayerizado en las características del ruido en el campo de los pixeles, el siguiente análisis proporcione detalles sobre las características del ruido en el campo de la frecuencia.

Ruido en el campo de la transformada de Fourier y comparación con el grano de película

El espectro de la frecuencia es importante para la visión humana. Las frecuencias muy altas son menos visibles que las frecuencias medias o bajas, como consecuencia de la función de sensibilidad al contraste (CSF). Como, por regla general, el grano de película se considera más agradable a la vista que el ruido de los captores digitales, es interesante comparar el espectro del ruido de una cámara digital con el de la película escaneada.

Densidad espectral de potencia de una señal aleatoria en la banda de 0kHz-20kHz estimada mediante el método de Welch.
Densidad espectral de potencia de una señal aleatoria en la banda de 0kHz-20kHz estimada mediante el método de Welch.

La comparación se realiza a partir de la densidad espectral de potencia, que es el cuadrado de la amplitud del ruido transformado. Para el ruido de cámara utilizamos el modelo de ruido del sensor, tal y como lo describimos con anterioridad, y le aplicamos la cadena de procesado para obtener imágenes ruidosas en LogC.

El grano de película se obtiene capturando una carta de gris neutro calibrada –que constituye un área homogénea– con diferentes emulsiones fotoquímicas. Se escanea la película para obtener una representación digital con la misma resolución que su contrapartida digital. Acto seguido se calcula la densidad espectral de potencia, tanto para el grano de la película escaneada como para el ruido de cámara simulado, empleando el mismo procedimiento. En primer lugar, eliminamos el promedio total de la imagen ruidosa Isp con el tamaño de imagen N x M.

N_{sp} = I_{sp} - \frac{1}{NM} \sum\limits_{i,j=0}^{N,M} I_{sp}(i,j)

Se transforma la imagen ruidosa utilizando el algoritmo de la transformada rápida de Fourier (FFT) para obtener el espectro del ruido F(ω).

F(w) =\mathcal{F}(I_{sp})

La densidad espectral de potencia equivale al cuadrado de la amplitud normalizado por el tamaño de la imagen.

NPS(k,l) = \frac{1}{NM} {|F(k,l)|}^2

Luego se calcula y trama la mediana para bloques de 32 x 32 con el fin de elaborar las gráficas de malla de la densidad espectral de potencia.

Densidad Espectral de Potencia del ruido de una cámara digital y grano de película. (a), (b) y (c) muestran la DEP de la cámara digital en los canales rojo, verde y azul respectivamente, (d-f) muestran la DEP del grano de película en los canales rojo, verde y azul respectivamente (negativo de color Kodak Vision3 500T 5219). (g)-(l) muestran los datos de (d-f) en una escala logarítmica de base 10 utilizada para el eje z.
Densidad Espectral de Potencia del ruido de una cámara digital y grano de película. (a), (b) y (c) muestran la DEP de la cámara digital en los canales rojo, verde y azul respectivamente, (d-f) muestran la DEP del grano de película en los canales rojo, verde y azul respectivamente (negativo de color Kodak Vision3 500T 5219). (g)-(l) muestran los datos de (d-f) en una escala logarítmica de base 10 utilizada para el eje z.

Resulta evidente que el espectro del ruido de las cámaras digitales no es blanco, ya que muestra un pico hacia las bajas frecuencias. Probablemente, este hecho convierte el ruido de cámara en un elemento más visible para el sistema visual humano (HVS) que el ruido blanco.

Además, el ruido de cámara muestra una densidad espectral de potencia más alta para las altas frecuencias verticales y horizontales que para las diagonales, en particular en el canal de verde. Ambos resultados muestran que el espectro del ruido no es blanco, pero el espectro del grano de película es más amplio que el espectro del ruido de cámara digital y depende menos de la dirección.

Este fenómeno puede explicar porque es más sencillo para el cerebro humano aceptar el grano e incluso porque –en ocasiones– es incluso apreciado con finalidades artísticas. La densidad espectral de potencia del grano de película depende del tipo de emulsión se utilice. En la imagen que precede a este párrafo figuran las cinco clases más representativas.

Zoom sobre ejamplos de metraje típicos. En la fila superior, metraje típico de vídeo de consumo con mucho ruido. En la fila inferior película escaneada a 2K. De izquierda a derecha, imagen original (degradada), imagen con reducción de ruido N-PSD (algoritmo propuesto por Kokaram et al) y reducción de ruido AWGN de la misma varianza. en todos los casos, el N-PSD ofrece una preservación del detalle muy superior manteniendo la misma potencia de reducción de ruido en las zonas planas.
Zoom sobre ejemplos de metraje típicos. En la fila superior, metraje típico de vídeo de consumo con mucho ruido. En la fila inferior película escaneada a 2K. De izquierda a derecha, imagen original (degradada), imagen con reducción de ruido N-PSD (algoritmo propuesto por Kokaram et al) y reducción de ruido AWGN de la misma varianza. en todos los casos, el N-PSD ofrece una preservación del detalle muy superior manteniendo la misma potencia de reducción de ruido en las zonas planas.

A pesar de que el análisis de la densidad espectral de potencia es interesante para explicar la percepción humana, el campo de la frecuencia no resulta óptimo para la reducción del ruido de cámara. Anil Kokaram, Damien Kelly, Hugh Denman y Andrew Crawford han mostrado que se puede emplear un método basado en la transformada 3D rápida de Fourier para reducir el ruido no blanco, pero ese método no es una buena elección cuando el objetivo es el procesado de vídeo, ya que se almacena la imagen completa en la memoria antes de que se pueda aplicar la transformada rápida de Fourier.

Por lo tanto, debemos escoger una segunda representación para nuestro análisis –en el campo de la transformada de ondícula (wavelet)– para obtener una descripción del ruido de cámara que pueda ser más útil en el desarrollo de métodos de reducción de ruido. Los coeficientes de la ondícula también proporcionan información de frecuencia, pero además están localizados y se pueden computar basándose en datos adyacentes limitados espacialmente.

Ruido en el campo de la transformada de ondícula

Analizar las características del ruido de los coeficientes de ondícula –cuando el ruido de cámara está presente en las imágenes– es importante por tres razones. Primero porque los métodos que emplean la transformada de ondícula parecen especialmente prácticos para reducir el ruido de los datos de cámara. Puede ser difícil incluir la correlación espacial –de la que hablamos en nuestro artículo anterior– en los métodos de reducción de ruido en el campo del pixel. Sin embargo, los métodos de transformada de ondícula suponen una buena elección. En ellos, la correlación espacial conlleva una cantidad diferente de ruido en las diferentes bandas de frecuencia, que se representan mediante niveles de ondícula. Segundo, porque los métodos de reducción de ruido mediante transformada de ondícula han proporcionado buenos resultados por lo general. Y tercero, porque se pueden desarrollar de manera bastante eficiente para el procesado de vídeo.

Varianza de los coeficientes de ondícula sobre la varianza de entrada para el AWGN.
Varianza de los coeficientes de ondícula sobre la varianza de entrada para el AWGN.

El modelo de ruido de uso más común –el AWGN– tiene una distribución del ruido blanco en al campo de la frecuencia, es decir, es igualmente fuerte en todas las bandas de frecuencia. En contraposición, el ruido de cámara no es blanco a causa de la correlación especial. En el campo de la transformada de ondícula esto significa que el ruido depende del nivel.

Ondícula de Haar.
Ondícula de Haar.

Con un filtro Haar, el tipo de filtro de ondícula con menor complejidad, la operación de filtrado se corresponde a una media y una diferencia. Para una entrada no correlacionada, se puede calcular fácilmente la varianza de la salida de los filtros. No obstante, la señal está correlacionada espacialmente como consecuencia del proceso de debayerizado que se realiza previamente a la transformación.

Imagen original "Lenna" (izq.) y transformada de ondícula de Haar de nivel 1 sobre la imagen de "Lenna" (dcha.)
Imagen original «Lenna» (izq.) y transformada de ondícula de Haar de nivel 1 sobre la imagen de «Lenna» (dcha.)

En nuestra próxima entrega, realizaremos una simulación –con las imágenes generadas por ordenador que ya hemos empleado en otras ocasiones– para mostrar el verdadero efecto del debayerizado sobre la varianza del ruido en los niveles de la transformada de ondícula.

Dejar una respuesta

¡Por favor, introduce tu comentario!
Por favor, introduce aquí tu nombre

       

Los comentarios en esta página pueden ser moderados; en tal caso no aparecerán inmediatamente al ser enviados. Las descalificaciones personales, los comentarios inapropiados, de extensión desmesurada o con demasiados errores ortográficos podrán ser eliminados. Asimismo, en caso de errores considerados tipográficos, el editor se reserva el derecho de corregirlos antes de su publicación con el fin de mejorar la comprensión de los mismos. Recordamos a los lectores que el propósito final de este medio es informar. Para recibir soporte sobre dispositivos o problemas particulares les invitamos a contactar con el correspondiente servicio de atención al cliente.