320 likes | 440 Views
Reconocimiento de cara basado en “ espectrocara ”. Procesamiento de Imágenes Digitales Grupo 18 : Macarena Carmen Ramos Rivera Juan Manuel Nieto Moreno Álvaro Sánchez Del Águila Jiménez. Contenido. Introducción Planteamiento del problema Pipeline de transformaciones
E N D
Reconocimiento de cara basado en “espectrocara” Procesamiento de Imágenes Digitales Grupo 18: Macarena Carmen Ramos Rivera Juan Manuel Nieto Moreno Álvaro Sánchez Del Águila Jiménez
Contenido • Introducción • Planteamiento del problema • Pipeline de transformaciones • Almacenamiento y comparación • Experimentación • Conclusiones
Contenido • Introducción • Planteamiento del problema • Pipeline de transformaciones • Almacenamiento y comparación • Experimentación • Conclusiones
Introducción ¿Quién es?
Reconocimiento Facial • Un sistema de reconocimiento facial es una aplicación dirigida por ordenador que identifica a una persona en una imagen digital. • Consiste analizar las características faciales del sujeto extraídas de la imagen y compararlas con una base de datos.
Espectrocara La representación de espectrocara es invariante a la traslación, escala y rotación en el plano. ¿Puede reconocer la cara con 3 tipos diferentes de rotación?
Contenido • Introducción • Planteamiento del problema • Pipeline de transformaciones • Almacenamiento y comparación • Experimentación • Conclusiones
Planteamiento del Problema Carlos Transformación Comparación Entrada Espectrocara Fase de reconocimiento
Planteamiento del Problema … … Almacenamiento Transformación Entrada Fase de entrenamiento
Contenido • Introducción • Planteamiento del problema • Pipeline de transformaciones • Almacenamiento y comparación • Experimentación • Conclusiones
Pipeline de Transformaciones • Preprocesamiento • Extensión • Transformada Wavelet • Transformada Fourier • Coordenadas Polares • Transformada Fourier λ = lnρ
Preprocesamiento • Conversión Escala Grises Traducción del valor de los pixeles en el rango de grises. • Ecualización de histograma Maximiza el contraste de la imagen sin perder información • Normalización de la intensidad Evita los cambios bruscos de iluminación y mejora el contraste de la imagen
Extensión • Transformará la imagen convirtiéndola en una cuadrada y con resolución potencia de 2 mayor que 32. Esto se realiza como requisito de las siguientes transformaciones.
Transformada Wavelet • Descompone la imagen en cuatro bandas de frecuencias pero usamos la banda LL, porque es la mejor aproximación a la imagen original.
Transformada Wavelet • Se calcula el número de iteraciones necesarias para obtener la imagen de banda LL con una resolución 32x32. Siendo: n =log(w / 32) / log 2
Transformada de Fourier • Básicamente se obtiene el espectro de frecuencias de una función. Cada porción de la transformada corresponde a una frecuencia espacial diferente sobre el objeto.
Coordenadas Polares • El sistema de coordenadas polares es un sistema de coordenadas bidimensional donde cada punto del plano se determina por un ángulo θ y una distancia r. Después de realizar esta transformación tendremos una imagen de 22,627 x 360.
Transformada Fourier λ = lnρ • Esta transformada trata de conseguir la invariabilidad de todas las propiedades de Fourier. Se realiza un mapeado sobre la representación polar del paso anterior de forma que la componente x se transforme en λ = lnρ.
Contenido • Introducción • Planteamiento del problema • Pipeline de transformaciones • Almacenamiento y comparación • Experimentación • Conclusiones
Almacenamiento • Se han usado dos métodos: • Representación vectorial o de clase • Representación unitaria Basada en el trabajo Experimental
Almacenamiento • Tanto para una como para otra obtenemos: Mapa <String, String> Nombre imagen/vector Nombre de la persona Aleatorio
Comparación • Se han usado tres métodos: • Distancia euclídea clásica • Ventana de 10 • Ventana de 20 Basada en el trabajo Experimentales
Contenido • Introducción • Planteamiento del problema • Pipeline de transformaciones • Almacenamiento y comparación • Experimentación • Conclusiones
Experimentación • Se han realizado diferentes test de JUnit con las siguientes variaciones y premisas: • Comparando métodos de almacenamiento. • Enfrentando métodos de comparación • Siempre la imagen de la persona comparada no estaba entrenada • Diferentes conjuntos de entrenamiento: 10, 15, 20 0 25 personas con 9 imágenes entrenadas cada uno.
Experimentación Tiempo medio: 2,5 seg por persona Almacenamiento vectorial
Experimentación Tiempo medio: 19 seg por persona Almacenamiento masivo
Experimentación • Conclusiones sobre la experimentación: • No se llega a los valores esperados : En torno al 90%. • Aceptable para pocos individuos. • Se estabiliza el acierto a partir de un número. • La mejora de los métodos experimentales no es significativa debido a su elevado coste computacional y de memoria.
Contenido • Introducción • Planteamiento del problema • Pipeline de transformaciones • Almacenamiento y comparación • Experimentación • Conclusiones
Conclusiones • Problemas encontrados: • Amplitud del campo de trabajo. • Descripción breve o nula de algunos métodos del procesado • Explicación detallada de la demostración del método de invariabilidad frente a nula explicación sobre su aplicación. • Ausencia de mención sobre el propagación de dimensiones entre procesados. • Interpretación más libre de algunos métodos para su implementación. • Transformada invariante. • Transformade Polar.
Conclusiones • No se ha conseguido un porcentaje de acierto como el esperado, posiblemente debido a las complicaciones de la implementación. • Se ha podido realizar la completitud del método y la aplicación, así como una experimentación que ha ayudado a conocer el comportamiento real de nuestro programa. • Se ha conseguido una aplicación dónde se puede ver un tratamiento real de imágenes.
Conclusiones • Posibles ampliaciones: • Cambiar el método de invariabilidad por otro de los descartados en el artículo como el Fourier-Mellin, para así poder mejorar el reconocimiento. • Mejoras en la interfaz como ajuste de ventana para la transformada polar o cambios en el menú principal. • Usar nuevas estrategias de clasificación y comparación.