En esta última entrega, continuamos dando respuestas –en la medida de lo posible– a las preguntas que nos hicimos en la introducción de estos artículos –a modo de resumen– y proponemos una serie de conclusiones provisionales al respecto.

¿Cómo se pueden ajustar los métodos de reducción de ruido para conseguir la mejor calidad visual?

De cara a obtener la mejor calidad visual posible, debemos optimizar la fortaleza del proceso de reducción de ruido para cada imagen. En la mayoría de las publicaciones científicas, los parámetros que regulan la fortaleza del proceso de reducción de ruido se optimizan para alcanzar una Proporción Máxima de Señal a Ruido (PSNR) elevada en cada una de las imágenes de prueba.

En el mundo real, no podemos aplicar semejante optimización, ya que no disponemos de una imagen de referencia. Para complicar aún más las cosas, la PSNR no se corresponde bien con la percepción humana de la calidad visual. La solución que se ha propuesto a este dilema es la de emplear un método para la optimización automática de los parámetros.

Histograma orientado a gradientes.
Histograma orientado a gradientes.

Semejante aproximación supone comparar el histograma orientado a gradientes de una imagen, a la que le hayamos aplicado la reducción de ruido, con un histograma orientado a gradientes de referencia –que se calcula basándose en el submuestreo y remuestreo de la imagen ruidosa–. Este método trabaja, por tanto, sin referencia y se adapta a la imagen.

Los métodos como los histogramas de gradientes orientados obtienen resultados muy buenos para detectar los bordes de un objeto aunque haya cambios de color, sombras o texturas de gran complejidad.
Los métodos como los histogramas de gradientes orientados obtienen resultados muy buenos para detectar los bordes de un objeto aunque haya cambios de color, sombras o texturas de gran complejidad.

Tanto los resultados de pruebas subjetivas –con participantes humanos– como su comparación con medidas de calidad de referencia, muestran que el citado método calcula muy bien los parámetros. De hecho, alcanza mayor calidad de imagen que cualquier otra medida sin referencias preexistente. Requiere únicamente recursos muy limitados y fáciles de desarrollar. Es de esperar que resulte muy atractivo para aplicaciones en tiempo real.

¿Cómo se pueden evaluar los métodos de reducción de ruido de manera apropiada y cuáles son los factores de importancia que influyen en la visión humana?

La evaluación realista de aproximaciones a la reducción de ruido es compleja y difícil. Se basa casi siempre en modelos de ruido poco realistas o en datos de prueba irreales –o en ocasiones, en ambos–. Por ese motivo, se han propuesto dos estrategias de mejora de la evaluación de algoritmos de reducción de ruido en datos de vídeo.

Procesado de datos del sensor simulados para pruebas empleando ruido dependiente de la señal (SD) y AWGN.
Procesado de datos del sensor simulados para pruebas empleando ruido dependiente de la señal (SD) y AWGN.

La primera busca incorporar todos los pasos del procesado en cámara para permitir resultados más realistas. Se realizaron pruebas subjetivas con participantes humanos para identificar las propiedades del ruido de cámara que influencian a la percepción de la calidad visual. Los resultados mostraron que la dependencia de la señal y la correlación espacial del ruido de cámara influyen de forma significativa en la calidad visual.

El ruido correlacionado espacialmente –que se introdujo durante el paso del debayerizado– es notablemente más molesto que el Ruido Blanco Gaussiano Aditivo (AWGN). En consecuencia, incluir un modelo realista de ruido es imprescindible para cualquier investigación futura.

Resultados de la Puntuación de la Opinión Promedio (MOS) y de la Proporción Máxima de Señal a Ruido (PSNR) para las secuencias de prueba “Ciudad” y “paisaje” empleando el modelo de AWGN (con líneas discontinuas) y el del ruido realista dependiente de la señal (SD) –con líneas continuas–. El ruido no correlacionado se muestra procesado sin debayerizado a la izquierda y con debayerizado a la derecha.
Resultados de la Puntuación de la Opinión Promedio (MOS) y de la Proporción Máxima de Señal a Ruido (PSNR) para las secuencias de prueba “Ciudad” y “paisaje” empleando el modelo de AWGN (con líneas discontinuas) y el del ruido realista dependiente de la señal (SD) –con líneas continuas–. El ruido no correlacionado se muestra procesado sin debayerizado a la izquierda y con debayerizado a la derecha.

Si se pretende calcular la calidad visual a partir de los resultados de cualquier método de reducción de ruido sin acudir a los socorridos tests subjetivos –que suelen consumir mucho tiempo de investigación– es necesario utilizar medidas de calidad fiables. La comparación entre doce medidas sin referencia, otras doce con referencias completas y la prueba subjetiva antes mencionada arrojó detalles descorazonadores. Ninguna de las medidas de tal comparación reflejó de manera satisfactoria la percepción de la calidad visual de los seres humanos. Es imperativo mejorar la calidad de las medidas para obtener una evaluación fiable de los métodos de reducción de ruido.

Señal no restringida (diagrama superior). Filtro de paso de banda aplicado a la señal (diagrama del medio). Señal de banda de paso resultante (diagrama inferior). A(f) es la función de frecuencia de la señal o filtro en unidades arbitrarias.
Señal no restringida (diagrama superior). Filtro de paso de banda aplicado a la señal (diagrama del medio). Señal de banda de paso resultante (diagrama inferior). A(f) es la función de frecuencia de la señal o filtro en unidades arbitrarias.

La segunda estrategia se basa en esta realidad incómoda. La comprensión de la percepción humana del ruido es crucial para lograr una mejora significativa. Por eso, propone el estudio de la visibilidad del ruido partiendo de una prueba subjetiva. El lector recordará que, para la prueba, el ruido se filtraba primero con una pasabanda de diferentes frecuencias centrales y luego se agregaba a un fotograma de un vídeo. Se generaba nuevo ruido con las mismas características por cada fotograma. Entonces se mostraba este vídeo ruidoso a los observadores. Al principio como un fotograma independiente y más tarde como un vídeo. De este modo se podía evaluar la percepción del mismo ruido en una imagen fija y en una secuencia en movimiento.

Función seno para A = ω = 1 y φ = 0.
Función seno para A = ω = 1 y φ = 0.

Los resultados de la prueba mostraron que la sensibilidad al contraste para el ruido de baja frecuencia espacial es mayor que para el ruido de altas frecuencias espaciales. Una premisa que casa bien con los resultados previos obtenidos con sinusoides. Aunque la tendencia es visible tanto en las imágenes fijas como en los datos de vídeo, la diferencia de sensibilidad es manifiestamente superior en las secuencias de vídeo.

Es un hecho, por consiguiente, que el ruido de baja frecuencia resulta más visible en una secuencia de vídeo que en una imagen fija. Como era de esperar, tales resultados explican la caída de calidad en las secuencias de imágenes –con ruido correlacionado espacialmente– en comparación con el AWGN. También aclaran la alta degradación que permanece en los vídeos –a través del ruido de baja frecuencia– después de que se realice el proceso de reducción de ruido.

Procedimiento clásico de suavizado de la señal.
Procedimiento clásico de suavizado de la señal.

Otra conclusión imperiosa es que hay que cesar de una vez por todas de emplear medidas de estimación de calidad diseñadas para imágenes fijas en las secuencias de vídeo –sean ruidosas o con algoritmos de reducción de ruido aplicados–. Por los motivos detallados, resultan en gran medida inútiles. Los factores de compensación de la sensibilidad se deberían incluir en las medidas de calidad futuras, si aspiramos a mejorar los cálculos de calidad visual en vídeo.

Conclusión – ¿Está muerta la reducción de ruido?

Con independencia del enorme corpus de investigación teórica y práctica que acumula este campo, las preguntas que hemos intentado responder en esta serie dejan claro que sigue habiendo margen para la mejora. Hemos mostrado que es posible alcanzarla besándonos en modelos de ruido de cámara realistas.

Por una parte, como en toda investigación científica, ha llegado el momento en el que toca colgar la bata un rato, remangarse un poco y dejar de preguntarse a qué huelen las nubes. La imprescindible física teórica debe ceder el paso a la mundana ingeniería.

Ya existen métodos adaptados al ruido de cámara, basados en la transformada del coseno discreta (DCT) y en la transformada de ondícula (wavelet). Pero existen otros muchos tipos de métodos de reducción de ruido. Se puede y se debe tratar de encontrar sistemas eficientes para los datos de cámara con estos otros tipos, de la misma forma que se han encontrado factores de ganancia de ruido aplicables a la reducción de ruido por medio de la ondícula.

Ejemplo de la Transformada de la Ondícula Discreta (DWT) que se emplea en el codec JPEG2000.
Ejemplo de la Transformada de la Ondícula Discreta (DWT) que se emplea en el codec JPEG2000.

Los métodos de bajo coste propuestos para ajustar los parámetros no pretenden servir como medida de calidad generalizada. Una de cal y una de arena. En el campo de la física, es la investigación de la visión humana la que necesitamos que siga avanzando para resolver –en última instancia– los problemas que aún tenemos con el procesado de la imagen en movimiento.

Terminar escribiendo el código adecuado es la consecuencia y no el fin último de nuestra búsqueda. Una medida de la calidad visual que reflejara de verdad la percepción humana permitiría avances vertiginosos en la reducción de ruido y facilitaría encontrar la solución de compromiso idónea entre la calidad visual y los recursos de desarrollo.

ARRI ALEXA Mini con sus "tripas" al descubierto, mostrando el cuerpo disipador y las placas que lo rodean. © ARRI Australia.
ARRI ALEXA Mini con sus “tripas” al descubierto, mostrando el cuerpo disipador y las placas que lo rodean. © ARRI Australia.

La reducción de ruido no está muerta. Debemos esperar muchos nuevos hitos en la investigación futura.

Dejar una respuesta

¡Por favor, introduce tu comentario!
Por favor, introduce aquí tu nombre

Los comentarios en esta página pueden ser moderados; en tal caso no aparecerán inmediatamente al ser enviados. Las descalificaciones personales y los comentarios inapropiados que no tengan que ver con el tema a tratar serán eliminados.