Cuando hablamos de sensores de imagen digitales hablamos también de bits. Elementos indisociables de la tecnología digital que aparecen relacionados en muchos de los procesos que se desarrollan dentro del sensor para la formación de la imagen final, y en especial con la interpretación del color.

La representación del color es una de las aspectos críticos del sensor, como ya pudimos ver en Sensores de imagen – Buscando el color o en Sensores de imagen – Filtros y colores. En este sentido, el concepto de profundidad de bit o «bit depth» es uno de los puntos clave, y suele definirse como el número de bits empleados para indicar cada una de las componentes de color individuales (canales) que forman un determinado «píxel».

Sensores de imagen
Colores RGB

En una pauta clásica de Bayer, correspondería al número de bits utilizado para medir cada uno de los tres colores primarios (Rojo, Verde, Azul), pero dependiendo del filtro de color utilizado, podrían existir otros canales. En la literatura, se suele representar como «bpc» («bits per channel/component»), pero a veces este término suele dar lugar a confusiones pues se utiliza también, por abuso de lenguaje, para expresar la profundidad de color (por «bits per color»).

La profundidad de color o «color depth», sin embargo, se emplea para indicar el número total de bits que un píxel utilizar para representar el color, y que, en el caso de Bayer anteriormente citado, sería la suma de las tres componentes de color individuales –los tres canales de colores primarios RGB–. En este caso hablamos entonces de «bpp» («bits per píxel»), que sería igual a bpp = 3 x bpc («bit depth»).

Sensores de imagen
Espectro de color SRGB

La profundidad de bit («bit depth») es pues uno de los aspectos claves en la determinación de la representación del color, pues expresa la precisión con la que se puede discernir un nivel de color determinado (precisión de color), así como el rango de colores que pueden ser representados («gamut» o gama de color).

Un ejemplo clásico sería el uso de una profundidad de bit de 8 bits, que permite distinguir entre 28=256 niveles de intensidad para cada canal primario –en caso de una imagen en blanco y negro, hablaríamos de 256 niveles de gris–, lo que daría lugar a una profundidad de color –para el caso de Bayer– de 24 bits. En este ejemplo, el número total de colores que se pueden representar sería 2bpp = 224, es decir, más 16 millones de colores posibles.

Sensores de imagen
Representación del gamut de color

Este número de combinaciones es superior al número de colores diferentes que el ojo humano es capaz de distinguir, pero eso no significa que dichas combinaciones no sean necesarias, pues dependerá de la codificación del color y el espacio de color utilizados.

En efecto, dependiendo del sistema o aplicación, lo que interesa es tener cubiertos un gran número de tonos intermedios, y para ello es necesario incrementar el número de colores representables y, por tanto, la profundidad de bit inicial con la que trabaja el sensor.

Uno de los efectos no deseados que suelen producirse cuando se utiliza una profundidad de bit insuficiente es la «posterización«, algo que también ocurre cuando un proceso cualquiera hacer «estirar» el histograma –por ejemplo, al modificar las curvas de nivel de la imagen–.

Sensores de imagen
Ejemplo (sin «posterización»)

Sensores de imagen
Ejemplo (con «posterización»)

La profundidad de bit o «bit depth» también guarda relación con otro de los aspectos cruciales de todo sensor de imagen: el rango dinámico. Efectivamente, generalmente los sensores hacen uso de una codificación lineal, de modo que para poder ofrecer un paso más de rango dinámico es necesario un bit de más, para doblar el número de niveles disponibles.

Pero se trata este de un punto especialmente delicado, pues el rango dinámico depende de muchos factores, y a pesar de que algunos fuentes lo comparen directamente con la profundidad de bit, la realidad es que el rango dinámico está fuertemente ligado a las capacidades reales del sensor en sí que dependen en gran medida de su implementación física.

Sensores de imagen
El rango dinámico del sensor de imagen depende sobre todo de su implementación física

Si bien es cierto que desde un punto de vista meramente teórico se podría argumentar que con 8 bits por canal se podrían representar 28 diferentes niveles de intensidad lumínica que corresponderían a 8 posibles pasos de rango dinámico, esto no es cierto en la práctica pues hay que tener en cuenta por ejemplo el nivel de ruido presente en el circuito del sensor, que hacen que el rango dinámico efectivo en el sensor sea menor, puesto que este, en el fondo, se mide como la relación entre el nivel más alto que se puede medir –antes de saturación del fotodiodo– y el más bajo –que viene determinado por este nivel de ruido inherente–.

Sensores de imagen
El ser humano no percibe la intensidad lumínica de forma lineal –es decir, del modo que se registra en el sensor– sino de forma logarítmica, motivo por el cual se aplican comúnmente correcciones de gama de color

A pesar de ello, en general trabajar con una mayor profundidad de bit –y, por tanto, de la profundidad de color resultante– permite también obtener un rango dinámico potencialmente mayor, pero sobre todo posibilita un mejor control del gama de color y de la posterización, al permitir ajustar las curvas de nivel con mayor libertad. Como contrapartida, trabajar con un número de bits más grande incrementa el tamaño de los ficheros correspondientes y la capacidad de cálculo necesaria para procesarlos.

4 Comentarios

  1. Un artículo muy completo e interesante.
    Conozco gente obsesionada con la profundidad de bit de su cámara, para hacer jpg y subirlos a Facebook. El mundo de la fotografía es fascinante.

    • Muchas gracias por el comentario. Efectivamente, es un mundo fascinante, cuyas tripas esconden muchos detalles que desentrañar, y en especial todo lo referente a los sensores de imagen, cuya comprensión ayuda a entender todo lo que ocurre en el interior de la cámara. Un saludo.

  2. Buenas,

    Cuando se habla del número total de colores que se puede representar, por ejemplo, con 8 bits (más 16 millones de colores) no dejo de pensar en lo confundidos que estamos los consumidores y como favorece eso a los fabricantes. Ellos solo engañan, pero no mienten.

    El concepto de «color» depende de 3 variables (tono, saturación y luminosidad), sin embargo popularmente solemos entender el «tono» como el «color». Y así nos vamos con la idea de que un sensor o un monitor puede representar 16’7 millones de tonos distintos, afirmando que es más de lo que el ojo humano puede percibir.

    «Este número de combinaciones es superior al número de colores diferentes que el ojo humano es capaz de distinguir»

    ¿Como puede ser que, en un monitor a 8 bits (más de 16’7 millones de combinaciones) podamos detectar la citada posterización? (como el llamado banding). Solo por que el ojo humano sí percibe más de lo que el monitor puede mostrar, de lo contrario no habría posterización (para los humanos) y nunca se venderian monitores de más de 8 bits.

    Fijándome en la gamma cromática sRGB presentada en el artículo veo un pequeño triángulo dentro de un diagrama de cromaticidad (espacio de color CIE 1931). Este diagrama, mucho más grande que el espacio sRGB, tampoco representa todos los colores que el ojo humano percibe. Ningún diagrama bidimensional es capaz de hacerlo. Se necesita representar las 3 propiedades que definen un color. En el caso que nos ocupa faltaria añadir en el eje Z las luminosidades de cada tono, del negro hasta el blanco. Hay unos cuantos diagramas para eso, pero todos ellos tridimensionales.

    Lo que vengo a decir es que el código binario, con sus más de 16’7 millones de combinaciones, no corresponde solo a ese triángulo. No corresponde a lo que comunmente solemos entender como color, sinó solo al tono y saturación. Además de eso, en ese código debe caber la información de la luminosidad, todo ello usando los distintos niveles de R, G y B. Eso nos deja menos código para digitalizar los tonos (que serán mucho menos de 16’7 millones) y nos explica por qué, en un espacio sRGB, todavía vemos artefactos en gradaciones suaves de color o luminosidad (como cielos al atardecer y sombras muy ténues). Ningun fabricante te dice que los 16’7 millones de colores no son solo tonos y saturación, pero deja que lo entiendas mostrando esa cifra junto al diagrama de cromaticidad sRGB.

    Si en algo me equivoco, por favor, sean tan amables de corregirme
    ¡Un saludo!

    • Estimado SerGi,

      Ante todo perdónanos la demora en contestar, es muy interesante el campo que describes y teníamos que encontrar el tiempo suficiente para responderte pausadamente como te mereces.

      Muchas gracias por tu extensa reflexión. La teoría del color es ciertamente compleja, y el objetivo de este artículo no pretendía ser una elaborada disertación sobre la misma, mas bien una pequeña introducción a algunos de los problemas de la gestión de color.

      Aun así, trataremos de responderte a alguno de las dudas que planteas:

      – Los diagramas utilizados para la representación de la cromaticidad suelen manejarse por practicidad en una versión proyectada en 2 dimensiones de un espacio tridimensional que, como bien dices, suele tener relación directa con las características que definen un color concreto (tono, saturación y brillo). Esta representación en 2D, más fácil de interpretar, suele fijar uno de los valores del tercer eje, en el caso que nos ocupa, la luminanciao, a un valor del 50%, con tal de fijar los otros dos parámetros (tono y saturación) que definen la cromaticidad. El caso más claro para entender esto son los típicos diagramas XY del “gammut” de un dispositivo, cuando en realidad el espacio que los describe es tridimensional, puedes entender mucho mejor este punto en cualquiera de nuestras últimas pruebas relacionadas con gestión de color.

      Sin embargo, no es que se necesiten los tres ejes para representar un color, y que con dos no se pueda hacer. Ambos casos (2D y 3D) no dejan de ser interpretaciones de un modelo de color que nos sirve para poder trabajar con él –así como realizar las pertinentes comparaciones–, pero en ningún caso pueden definir todos los colores que un humano puede percibir. Los esfuerzos que el CIE –Comission International de l’Écleraige– realizó es su momento se basaron en un conjunto de aproximaciones para poder crear un modelo de referencia en el cual apoyarse, a partir de los datos subjetivos obtenidos con observadores “estándar”. De hecho, la propia conversión de la representación CIELab a CIEXYZ realiza en sí otro conjunto de aproximaciones, relacionando la respuesta de los tres tipos de conos humanos a las conocidas características de tono, saturación y brillo.

      – Por otro lado, en referencia al número de bits utilizado para la profundidad de bit, haces el supuesto que los 8*3=24 bits utilizados –que dan un total de 16,7 millones de colores– se tiene que usar para los distintos niveles de RGB; nadie impide que unos cuantos de esos bits ser utilizan para el nivel de brillo, mientras que otros se usen para definir la cromaticidad. Asimismo, el hecho de disponer de una capacidad teórica de representar 16,7 millones de posibles combinaciones, no significa tampoco que el dispositivo en cuestión –un monitor, por ejemplo– pueda efectivamente representarlos a partir de sus LUT, puesto que depende de muchos otros factores –limitaciones físicas, calibración, calidad de sus componentes, etc.– que distan muchos de los valores teóricos.

      No obstante respecto a la calidad de los gradientes, eliminación de efecto bandeado y matices intermedios, trabajar bajo un LUT interno de 10 bits o más está directamente relacionado, dado que la pantalla puede manejar y exprimir mejor las capacidades del panel, sementado de manera más certera toda su latitud y amplitud cromática.

      Cierto es que la frase “Este número de combinaciones es superior al número de colores diferentes que el ojo humano es capaz de distinguir” es ambigua y puede inducir a conclusiones erróneas, así que la modificamos acorde a lo aquí comentado. Gracias de nuevo por tu comentario. Un saludo.

Dejar una respuesta

¡Por favor, introduce tu comentario!
Por favor, introduce aquí tu nombre

       

Los comentarios en esta página pueden ser moderados; en tal caso no aparecerán inmediatamente al ser enviados. Las descalificaciones personales, los comentarios inapropiados, de extensión desmesurada o con demasiados errores ortográficos podrán ser eliminados. Asimismo, en caso de errores considerados tipográficos, el editor se reserva el derecho de corregirlos antes de su publicación con el fin de mejorar la comprensión de los mismos. Recordamos a los lectores que el propósito final de este medio es informar. Para recibir soporte sobre dispositivos o problemas particulares les invitamos a contactar con el correspondiente servicio de atención al cliente.