270 likes | 513 Views
Clasificación de imágenes digitales de texturas usando la transformada Guillen. J. Trinidad Guillen Bonilla, H. Guillen Bonilla, A. Guillen Bonilla, Dulce H. Arias Jiménez y R.C. Michel. Distribución de plática. 1. Introducción 2. Transformada Guillen
E N D
Clasificación de imágenes digitales de texturas usando la transformada Guillen J. Trinidad Guillen Bonilla, H. Guillen Bonilla, A. Guillen Bonilla, Dulce H. Arias Jiménez y R.C. Michel
Distribución de plática 1. Introducción 2. Transformada Guillen 2.1. Método para obtener la función de probabilidad 2.2. Unidad Patrón Local (d) de imagen de niveles de gris 2.3. Dimensionalidad de transformada Guillen 2.4. Información obtenida por la transformada Guillen desde la imagen de niveles de gris 3. Clasificación de imágenes usando la transformada Guillen 4. Trabajo experimental 5. Conclusiones Referencias
1. Introducción • En este trabajo presentamos la transformada Guillen. La transformada hace un mapeo de patrones locales desde una imagen de niveles de gris y define una distribución de probabilidad de ocurrencias de estos patrones. El patrón es detectado por medio de una ventana móvil que se desplaza sobre toda la imagen con pasos de un píxel. Este es convertido a un valor decimal al multiplicarlo por una matriz de pesos elemento por elemento y el resultado es sumado. Este valor decimal es asignado al histograma ecualizado que representa a la imagen de niveles de gris. Los valores de niveles de gris son desde 1 a 256. Usando un patrón local se define la dimensionalidad del espacio característico de la transformada Guillen. Empleando la función de probabilidad de la transformada Guillen se define la entropía o información promedio obtenida desde la imagen digital por la transformación. Se realizan experimentos donde se calcula la: transformada Guillen, entropía y dimensionalidad del espacio característico.
Cálculo de: Coordinated Cluster Representation (CCR) y Local Binary Pattern (LBP) a) b) c) d) Figura 1. Cálculo de CCRL = 1+4+8+16+64 = 93 a) b) c) d) Figura 2. Cálculo de LBP = 1+4+8+16+64 = 93 y el contraste C = (6+7+9+5+8)/5 - (4+1+3)/3 = 9.7.
2. Transformada Guillen • La transformada Guillen realiza un mapeo de patrones locales desde una imagen de niveles de gris y define una función de probabilidad de ocurrencias Figura 3. Mapeo producido por la función.
Detección de Patrón Local desde una y imagen de niveles de gris calculo de Unidad de Patrón Local (d) Figura 4. Cálculo de la Unidad de Patrón Local (d) en la transformada Guillen de una imagen de niveles de gris.
2.1 Detección de Patrón Local desde una y imagen de niveles de gris calculo de Unidad de Patrón Local (d) (1) [1] Figura 5. Función de probabilidad de ocurrencias de patrones locales desde una imagen de 630x876 píxeles usando una ventana móvil de 3x3 píxeles
2.2. Unidad de Patrón Local (d) • La Unidad de Patrón Local (d) es definido como el valor obtenido desde un Patrón local (ξ) detectado por una ventana móvil sobre la imagen de niveles de gris multiplicado por una matriz de pesos B. La matriz tiene la forma de acuerdo a la siguiente ecuación, (2)
Cálculo de Unidad de Patrón Local (d) Figura 3. Procedimiento para calcular Unidad de Patrón Local (d)
2.3. Dimensionalidad de transformada Guillen • La dimensionalidad de la transformada Guillen (D) se define considerando un Patrón Local ξ con todos sus elementos igual a 256 y la matriz B. (3)
Ejemplos de dimensionalidad de la Transformada Guillen para ξ de diferente tamaño
2.4. Información obtenida por la transformada Guillen desde la imagen de niveles de gris • En teoría fundamental de la información se tiene que la medición de información se modela como un proceso probabilístico [2,3]. Como la transformada Guillen define una distribución de probabilidad de ocurrencias desde una imagen de niveles a través de un proceso aleatorio. Entonces, considerando la imagen de niveles de gris S como una fuente de información se tiene que la información de un patrón local es definido como • (4) • La unidad de medición de información es el bit (Unidad binaria). Por otro lado, la entropía mide la información promedio desde una serie de posibles probabilidades • . Sabiendo que la transformada Guillen es una función de probabilidad obtenida de la imagen S. Entonces tenemos que la información promedio obtenida por la transformada Guillen desde la imagen es • (5)
3. Clasificación de texturas consiste de dos etapas: el aprendizaje y el reconocimiento. En la primera, se extraen las características de imágenes de clases conocidas y cada clase se caracteriza por un vector prototipo de características (class mean, centroid). En la segunda, se extrae el vector de características de una imagen de prueba y el último se compara con los vectores prototipos de características de clases conocidas: la imagen de prueba se asigna a la clase cuyo vector prototipo es más cercano al vector de características de imagen de prueba.
Clasificación de textura en múltiples clases ¿A cuál de las 10 clases de arriba pertenece esta subimagen de prueba? Subimagen
Se calcula la G(ξd) para cada submagen Generación de Prototipos de Clase Vectores de Características Prototipos de Clases Clasificación Aprendizaje IMÁGENES DE CADA CLASE EXTRACCIÓN DE CARACTERÍSTICAS Imágenes de niveles de gris
IMAGEN DE PRUEBA Imagen de prueba de 256 niveles de gris Clasificación - Reconocimiento CLASIFICADOR EXTRACCIONDE CARACTERÍSTICAS G(ξ) de la Imagen Clasificador de Distancia Mínima (Norma L1) Resultado de la Clasificación Firma de Prueba
4. Trabajo experimental • El trabajo experimental esta dividido en dos etapas: en la primera etapa se calcula la distribución de probabilidad G(ξ), la dimensionalidad y la entropía (H) de la imagen de niveles de gris Smostrada en la Figura 6. El tamaño de la imagen es 630x876 píxeles. En la segunda etapa se realiza la clasificación de imágenes usando la función de probabilidad G(ξ) como vector característico. Las imágenes empleadas en la clasificación son del catalogo Outex y tienen tamaño de 205x205 píxeles. En ambas etapas se usa la versión de MaLat 7.4.0 (2007 2a), una Laptop Toshiba con 512 Mb RAM, 2.3 Mb de velocidad y patrones Locales ξcon tamaño de 3x3, 5x5, 7x7 y 9x9 píxeles. Ejemplos de mascaras de pesos ó matriz B son usadas en experimentos se presentan en la Tabla I. Figura 6. Imagen digital de niveles de gris usada en experimentos
Imágenes del catalogo Outex empleadas en segunda etapa de experimentos
Funciones de probabilidad G(ξ) para la Figura 6. Figura 8. Distribuciones de probabilidad de la Figura 6 usando patrones locales con tamaño de 3x3, 5x5, 7x7 y 9x9 píxeles.
Tabla III. Resultados de clasificación usando patrón local de 3x3 píxeles
Tabla IV. Resultados de clasificación usando patrón local de 5x5 píxeles
Tabla V. Resultados de clasificación usando patrón local de 7x7 píxeles
Tabla VI. Resultados de clasificación usando patrón local de 9x9 píxeles
5. Conclusiones • Se realiza la clasificación de imágenes usando la transformada Guillen. La función de probabilidad obtenida desde la imagen de niveles de gris por la transformada Guillen es usada como vector característico en un clasificador para múltiples clases basado en distancia mínima. Se hace el reconocimiento de imágenes de niveles de gris de textura del catalogo Outex y se tiene una eficiencia mayor al 99% en el reconocimiento. Al usar patrones locales de mayor tamaño la transformada Guillen obtiene mayor información desde la imagen de textura y por tanto mas eficiencia en el reconocimiento. El reconocimiento de patrones usando la transformada Guillen puede ser empleada en imágenes médicas, visión artificial, sensado remoto, control de calidad de superficies entre otra gran gama de aplicaciones.
Referencias • [1] E.V. Kurmyshev and M. Cervantes, A qusi-statistical approach to digital image representation,Rev. Mex. Fis. 42 (1), 104-116 (1996). • [2] R. B. Ash, Information theory, First Edition, Dover Publications, New York, (1990). • [3] S. Roman, Introduction to coding and information theory, First Edition, Dover Publications, New York, (1997).