Espacios de color
El uso del color en el procesamiento de imágenes está
principalmente motivado por dos factores:
⇒ El
color es un poderoso descriptor que, en la mayoría de los casos simplifica la
identificación y extracción de los objetos de una escena.
⇒ Los
humanos podemos distinguir miles de colores y sin embargo sólo dos docenas de
niveles de gris.
Debido a las características
del ojo humano y a la teoría tricromatica [5],
todos los colores que podemos reconocer en una imagen son una
combinación de los llamados colores primarios: R(Red/Rojo), G(Green/Verde) y
B(Blue/Azul). El objetivo de un modelo de color es facilitar la especificación
de los colores de una forma normalizada y aceptada genéricamente. En esencia,
un modelo de color es la especificación de un sistema de coordenadas
tridimensional y de un subespacio de este sistema en el que cada color queda
representado por un único punto. Entre los espacios de color utilizados más
frecuentemente para el procesamiento de imágenes se encuentran el RGB, YIQ,
CMY, YCbCr y HSI, los cuales se describirán en los siguientes apartados.
Generalmente las características para poder distinguir un
color de otro son: brillo, tono y saturación. El brillo es la luminosidad u
oscuridad relativa del color y normalmente se expresa como un porcentaje
comprendido entre 0% (negro) y 100% (blanco). El tono es el color reflejado o
transmitido a través de un objeto. Se mide como un ángulo en grados, entre 0º y
360º. Normalmente, el tono se identifica por el nombre del color, como rojo,
naranja o verde. Por último la saturación, a veces llamada cromatismo, se
refiere a la pureza relativa de la cantidad de luz blanca mezclada con el tono,
es decir, es la fuerza o pureza del color. La saturación representa la cantidad
de blanco que existe en proporción al tono y se mide como porcentaje entre
0%(gris) y 100%(saturación completa). En la rueda de colores estándar, la
saturación aumenta a medida que nos aproximamos al borde de la misma. Las
coordenadas de tono y saturación definen la cromaticidad, entonces un color
puede ser caracterizado por su brillo y cromaticidad [4],[6].
Modelo RGB
En el modelo RGB
cada color aparece en sus componentes espectrales primarias: rojo, verde y
azul. Este modelo está basado en el sistema de coordenadas cartesianas. El
subespacio de color de interés es el tetraedro mostrado en la Figura 5, en el
cual los valores RGB están en tres vértices; cian, magenta y amarillo se sitúan
en otros tres vértices, el negro corresponde al origen y el blanco se sitúa en
el vértice más alejado del origen. En este modelo, la escala de grises ese
extiende desde el negro al blanco a lo largo de la diagonal que une esos dos
puntos, y los colores son puntos dentro del tetraedro definidos por los
vectores desde el origen. Por conveniencia, se asume que todos los vectores han
sido normalizados, de modo que el tetraedro de la figura es el tetraedro
unitario, es decir, todos los valores de R, G y B están en el rango [0,1]. Las
imágenes en este modelo se forman por la combinación en diferentes proporciones
de cada uno de los colores primarios RGB.
Figura
5:
Modelo
RGB
Las imágenes del modelo de color RGB
consisten en tres planos de imagen independientes, uno por cada color primario.
Cuando llegan a un monitor RGB, estas tres imágenes se combinan en la pantalla
fosforescente para producir una imagen en color compuesta. De forma
alternativa, la mayoría de las cámaras de color empleadas para la adquisición
de imágenes digitales utilizan el formato RGB, lo que por sí solo hace de éste
un modelo importante en el procesamiento de imágenes.
Modelo CMY
Cian (C), magenta (M) y amarillo (Y) son
los colores secundarios de la luz, o bien los colores primarios de los
pigmentos. Se denominan sustractivos ya que se utilizan como filtros para
sustraer colores de la luz blanca. La mayoría de los dispositivos que depositan
pigmentos coloreados sobre papel, tales como impresoras y fotocopiadoras en
color, necesitan una entrada CMY o bien una conversión interna de RGB a CMY. El
sistema coordenado es el mismo que en modelo RGB pero donde había negro ahora
existe blanco y viceversa.
Figura
6:
Modelo
CMY
Modelo YIQ
El modelo YIQ se utiliza en las emisiones comerciales de
televisión. Básicamente el YIQ es una recodificación del RGB utilizada por su
eficacia en la transmisión y para mantener la compatibilidad con los estándares
de televisión en blanco y negro. La componente Y del sistema YIQ, proporciona
toda la información de vídeo que necesita un sistema de televisión
monocromático.
El modelo YIQ fue diseñado para aprovechar
la mayor sensibilidad del sistema visual humano a los cambios de la saturación.
Así los estándares YIQ emplean más bits para representar la Y y menos para
representar la I o Q.
Además de tratarse de un estándar
ampliamente difundido, la ventaja principal del modelo YIQ en el procesamiento
de imágenes es que la luminancia (Y) y la información del color (I y Q) están
desacopladas, así la importancia de este desacoplamiento radica en que la
componente de luminancia de una imagen puede procesarse sin afectar a su
contenido cromático.
Figura
7:
Modelo
YIQ
Modelo YCbCr
Se trata de una codificación no lineal del espacio RGB. El
parámetro Y indica la luminancia, los parámetros Cb y Cr indican el tono del
color: Cb ubica el color en una escala entre el azul y el amarillo, Cr indica
la ubicación del color entre el rojo y el verde. El espacio YCbCr es una versión escalada y desplazada del
espacio de color YUV. El parámetro Y representa la luminancia (es decir,
información en blanco y negro), mientras que U y V representan la crominancia
(es decir, información con respecto al color). Cb (Cr respectivamente) es la
diferencia entre la componente azul (rojo, respectivamente) y un valor de
referencia. La transformación de RGB a YCbCr
puede ser ejecutada utilizando la siguiente ecuación donde R, G y B
oscilan en el rango de [0, 1]. Y en el de [16,235], y Cb y Cr en el de
[16,240].
⎡Y ⎤ ⎛ 65.481 128.553 24.966
⎞ ⎡R⎤ ⎡16 ⎤
⎢⎢Cb ⎥⎥=⎜⎜
−39.797 −74.203 112 ⎟⎟ *⎢⎢G⎥⎥+⎢⎢128⎥⎥ (1)
⎢⎣Cr ⎥⎦ ⎝ 112 −93.786 −18.214 ⎠ ⎢⎣B⎥⎦ ⎢⎣128⎥⎦
En la práctica, generalmente se usa en los
estudios de televisión europeos y en la compresión de imágenes.
Figura
8:
Modelo
YCbCr
Modelo HSI
Sus siglas corresponden a H(Hue/Tonalidad),
S(Saturation/Saturación), I(Intensity/Intensidad). El modelo HSI debe su utilidad a dos hechos
básicos. Primero, la componente de intensidad, I, está desacoplada de la
información cromática contenida en la imagen. Segundo, las componentes de tono
y saturación están íntimamente relacionadas con la forma en que los seres
humanos percibimos el color. Estas características hacen que el modelo HSI sea
una herramienta ideal para desarrollar algoritmos de procesamiento de imágenes basados en
alguna de las propiedades de la percepción del color del sistema visual humano.
Figura
9:
Modelo
HSI
Elección
Una imagen en color está especificada por sus componentes
RGB. El modelo RGB es recomendable para visualizar el color, pero no es bueno
para su análisis ya que existe un alto grado de correlación entre sus
componentes R, G y B. Además, la distancia en el espacio de color RGB no
representa las diferencias de colores
tal como el sistema visual humano las percibe. Es por ello que en el análisis y
procesamiento de las imágenes, muchas veces se transforman estas componentes en
otro espacio de color. Todo espacio de color tiene sus ventajas y desventajas.
En nuestro algoritmo usaremos el espacio de color YCbCr para la segmentación
debido a tres razones principales [1]:
1.
El espacio de color YCbCr es comúnmente usado en las compresiones de
vídeo estándar (MPEG [7] y JPEG [8]).
2.
La diferencia de color en la percepción humana puede
ser aproximadamente expresada por la distancia Euclídea en el espacio de color.
3.
La intensidad y las componentes cromáticas pueden ser
controladas fácil e independientemente.
No hay comentarios:
Publicar un comentario