Espacios de color

El uso del color en el procesamiento de imágenes está principalmente motivado por dos factores:

⇒ El color es un poderoso descriptor que, en la mayoría de los casos simplifica la identificación y extracción de los objetos de una escena.

⇒ Los humanos podemos distinguir miles de colores y sin embargo sólo dos docenas de niveles de gris.

Debido a las características del ojo humano y a la teoría tricromatica [5], todos los colores que podemos reconocer en una imagen son una combinación de los llamados colores primarios: R(Red/Rojo), G(Green/Verde) y B(Blue/Azul). El objetivo de un modelo de color es facilitar la especificación de los colores de una forma normalizada y aceptada genéricamente. En esencia, un modelo de color es la especificación de un sistema de coordenadas tridimensional y de un subespacio de este sistema en el que cada color queda representado por un único punto. Entre los espacios de color utilizados más frecuentemente para el procesamiento de imágenes se encuentran el RGB, YIQ, CMY, YCbCr y HSI, los cuales se describirán en los siguientes apartados.

Generalmente las características para poder distinguir un color de otro son: brillo, tono y saturación. El brillo es la luminosidad u oscuridad relativa del color y normalmente se expresa como un porcentaje comprendido entre 0% (negro) y 100% (blanco). El tono es el color reflejado o transmitido a través de un objeto. Se mide como un ángulo en grados, entre 0º y 360º. Normalmente, el tono se identifica por el nombre del color, como rojo, naranja o verde. Por último la saturación, a veces llamada cromatismo, se refiere a la pureza relativa de la cantidad de luz blanca mezclada con el tono, es decir, es la fuerza o pureza del color. La saturación representa la cantidad de blanco que existe en proporción al tono y se mide como porcentaje entre 0%(gris) y 100%(saturación completa). En la rueda de colores estándar, la saturación aumenta a medida que nos aproximamos al borde de la misma. Las coordenadas de tono y saturación definen la cromaticidad, entonces un color puede ser caracterizado por su brillo y cromaticidad [4],[6].

Modelo RGB

En el modelo RGB cada color aparece en sus componentes espectrales primarias: rojo, verde y azul. Este modelo está basado en el sistema de coordenadas cartesianas. El subespacio de color de interés es el tetraedro mostrado en la Figura 5, en el cual los valores RGB están en tres vértices; cian, magenta y amarillo se sitúan en otros tres vértices, el negro corresponde al origen y el blanco se sitúa en el vértice más alejado del origen. En este modelo, la escala de grises ese extiende desde el negro al blanco a lo largo de la diagonal que une esos dos puntos, y los colores son puntos dentro del tetraedro definidos por los vectores desde el origen. Por conveniencia, se asume que todos los vectores han sido normalizados, de modo que el tetraedro de la figura es el tetraedro unitario, es decir, todos los valores de R, G y B están en el rango [0,1]. Las imágenes en este modelo se forman por la combinación en diferentes proporciones de cada uno de los colores primarios RGB.

Figura 5: Modelo RGB 

Las imágenes del modelo de color RGB consisten en tres planos de imagen independientes, uno por cada color primario. Cuando llegan a un monitor RGB, estas tres imágenes se combinan en la pantalla fosforescente para producir una imagen en color compuesta. De forma alternativa, la mayoría de las cámaras de color empleadas para la adquisición de imágenes digitales utilizan el formato RGB, lo que por sí solo hace de éste un modelo importante en el procesamiento de imágenes.

Modelo CMY

Cian (C), magenta (M) y amarillo (Y) son los colores secundarios de la luz, o bien los colores primarios de los pigmentos. Se denominan sustractivos ya que se utilizan como filtros para sustraer colores de la luz blanca. La mayoría de los dispositivos que depositan pigmentos coloreados sobre papel, tales como impresoras y fotocopiadoras en color, necesitan una entrada CMY o bien una conversión interna de RGB a CMY. El sistema coordenado es el mismo que en modelo RGB pero donde había negro ahora existe blanco y viceversa.

Figura 6: Modelo CMY 

Modelo YIQ

El modelo YIQ se utiliza en las emisiones comerciales de televisión. Básicamente el YIQ es una recodificación del RGB utilizada por su eficacia en la transmisión y para mantener la compatibilidad con los estándares de televisión en blanco y negro. La componente Y del sistema YIQ, proporciona toda la información de vídeo que necesita un sistema de televisión monocromático.

El modelo YIQ fue diseñado para aprovechar la mayor sensibilidad del sistema visual humano a los cambios de la saturación. Así los estándares YIQ emplean más bits para representar la Y y menos para representar la I o Q.

Además de tratarse de un estándar ampliamente difundido, la ventaja principal del modelo YIQ en el procesamiento de imágenes es que la luminancia (Y) y la información del color (I y Q) están desacopladas, así la importancia de este desacoplamiento radica en que la componente de luminancia de una imagen puede procesarse sin afectar a su contenido cromático.

Figura 7: Modelo YIQ 

Modelo YCbCr

Se trata de una codificación no lineal del espacio RGB. El parámetro Y indica la luminancia, los parámetros Cb y Cr indican el tono del color: Cb ubica el color en una escala entre el azul y el amarillo, Cr indica la ubicación del color entre el rojo y el verde. El espacio YCbCr es una versión escalada y desplazada del espacio de color YUV. El parámetro Y representa la luminancia (es decir, información en blanco y negro), mientras que U y V representan la crominancia (es decir, información con respecto al color). Cb (Cr respectivamente) es la diferencia entre la componente azul (rojo, respectivamente) y un valor de referencia. La transformación de RGB a YCbCr puede ser ejecutada utilizando la siguiente ecuación donde R, G y B oscilan en el rango de [0, 1]. Y en el de [16,235], y Cb y Cr en el de [16,240].

⎡^Y⎤ ⎛ 65.481 128.553 24.966 ⎞ ⎡^R⎤ ⎡¹⁶⎤

^⎢⎢C_b^⎥⎥=⎜⎜ −39.797 −74.203 112 ⎟⎟ *^⎢⎢G^⎥⎥+^⎢⎢128^⎥⎥ (1)

⎢⎣C_r⎥⎦ ⎝ 112 −93.786 −18.214 ⎠ ⎢⎣B⎥⎦ ⎢⎣128⎥⎦

En la práctica, generalmente se usa en los estudios de televisión europeos y en la compresión de imágenes.

Figura 8: Modelo YCbCr 

Modelo HSI

Sus siglas corresponden a H(Hue/Tonalidad), S(Saturation/Saturación), I(Intensity/Intensidad). El modelo HSI debe su utilidad a dos hechos básicos. Primero, la componente de intensidad, I, está desacoplada de la información cromática contenida en la imagen. Segundo, las componentes de tono y saturación están íntimamente relacionadas con la forma en que los seres humanos percibimos el color. Estas características hacen que el modelo HSI sea una herramienta ideal para desarrollar algoritmos de procesamiento de imágenes basados en alguna de las propiedades de la percepción del color del sistema visual humano.

Figura 9: Modelo HSI 

Elección

Una imagen en color está especificada por sus componentes RGB. El modelo RGB es recomendable para visualizar el color, pero no es bueno para su análisis ya que existe un alto grado de correlación entre sus componentes R, G y B. Además, la distancia en el espacio de color RGB no representa las diferencias de colores tal como el sistema visual humano las percibe. Es por ello que en el análisis y procesamiento de las imágenes, muchas veces se transforman estas componentes en otro espacio de color. Todo espacio de color tiene sus ventajas y desventajas. En nuestro algoritmo usaremos el espacio de color YCbCr para la segmentación debido a tres razones principales [1]:

1. El espacio de color YCbCr es comúnmente usado en las compresiones de vídeo estándar (MPEG [7] y JPEG [8]).

2. La diferencia de color en la percepción humana puede ser aproximadamente expresada por la distancia Euclídea en el espacio de color.

3. La intensidad y las componentes cromáticas pueden ser controladas fácil e independientemente.

Reconstrucción de Imagenes

jueves, 25 de septiembre de 2014

Modelos de Color