710 likes | 858 Views
LAMOP. OTELO. ArScAn. L3i. Projet ALPAGE. A na L yse diachronique de l’espace urbain PA risien : approche GE omatique. Romain Raveaux. Sommaire. 1°) Description du projet 2°) Analyse automatique du document graphique Extraction d’information 3°) Prétraitements
E N D
LAMOP OTELO ArScAn L3i Projet ALPAGE AnaLyse diachronique de l’espace urbain PArisien : approche GEomatique Romain Raveaux
Sommaire • 1°) Description du projet • 2°) Analyse automatique du document graphique • Extraction d’information • 3°) Prétraitements • 4°) Les espaces couleurs • 5°) La segmentation couleur • 6°) Conclusion et prospection
Description du projet • Objectif : Développer les recherches concernant l’espace urbain parisien. • Des logiciels de reconnaissance des formes adaptés aux plans cadastraux anciens • Un SIG (Système d’Information Géographique) • L’espace urbain parisien du XIVème et du siècle XIXème. • Interprétation sémantique des plans cadastraux de l’Atlas Vasserot. • Projet pluridisciplinaires : • Des Historiens médiévistes. • Des géographes spécialisés en géomatique. • Des historiens d’art spécialistes de Paris. • Des informaticiens spécialisés en reconnaissance des formes et vectorisation.
Sommaire • 1°) Description du projet • 2°) Analyse automatique du document graphique • Extraction d’information • 3°) Prétraitements • 4°) Les espaces couleurs • 5°) La segmentation couleur • 6°) Conclusion et prospection
Analyse automatique du document graphique • « Quand l’information fait sens. »1 • Apporter une information de sens à des amas de données inertes. • La rétro conversion : • Passer d’un document numérisé, sous forme de pixels bruts, à son interprétation sémantique. • 1Francisco Varela, « Autonomie et Connaissance »
Extraction d’information • Les parcelles en reprenant l’unité de couleur. • La présence d’un numéro de rue (et éventuellement la reconnaissance du numéro) • Le filaire des rues 19e • Le filaire des rues 14e
Extraction du filaire des rues Extraction du parcellaire Localisation des numéros des rues
Prétraitements Extraction de sens Formalisme de l’information Analyse automatique du document graphique
Sommaire • 1°) Description du projet • 2°) Analyse automatique du document graphique • Extraction d’information • 3°) Prétraitements • 4°) Les espaces couleurs • 5°) La segmentation couleur • 6°) Conclusion et prospection
Prétraitements • Améliorer la qualité de l’image : • Rehausser les couleurs. • Lutter contre l’affadissement des pigments couleurs. • Diminuer les bruits.
Restauration d’image • Théorie du monde blanc Après Avant
Restauration d’image • Extension dynamique Après Avant
Restauration d’image • Anti-affadissement Après Avant
Filtrage • Filtre Médian Après Avant
Sommaire • 1°) Description du projet • 2°) Analyse automatique du document graphique • Extraction d’information • 3°) Prétraitements • 4°) Les espaces couleurs • 5°) La segmentation couleur • 6°) Conclusion et prospection
Sommaire : Les espaces couleurs • Introduction • Les espaces couleurs. • RGB,La*b*,I1I2I3… • Les espaces couleurs « entraînés » • Les systèmes d’axes indépendants • Les espaces hybrides • Les espaces « artificiels » • Conclusion
Introduction • Cette présentation a pour but de déterminer quel espace couleur serait le plus adapté à la vectorisation des plans cadastraux du projet ALPAGE. • Nous assumons l’hypothèse qu’un espace couleur est « bon » s’il permet une bonne séparabilité des ensembles chromatiques.
Caractéristiques des images • Image couleur : R G B, 3 canaux, chaque canal est codé sur 8 bits. • Résolution : 200 points par pouce. • Illuminant : D65. • Taille moyenne : 70 MO
Analyse d’image • Distribution des pixels dans l’espace RGB :
Analyse d’image • Histogramme 3D des couleurs RGB :
Etude des descripteurs • Nous établissons la vérité terrain. • 9 classes (9 couleurs) • 246 pixels • Distance entre pixels • Soit p1, p2 deux pixels:
Etude des descripteurs Figure 1 : RGB Colors using Euclidean distance Figure 1 : Représentation des couleurs RGB en utilisant une métrique euclidienne.
Etude des descripteurs Figure 2 : RGB Clustering analysis Figure 2 : Analyse des clusters dans RGB. • These results show some confusion within the class 5. • The missclassified class5 elements are confused with the class 8. • Confusion à l’intérieur de la classe 5. • Les éléments mal classifiés sont mélangés avec la classe 8.
Espaces couleurs traditionnels • Nous constatons qu’il n’y a pas d’espaces couleurs qui se détachent particulièrement. • Ces espaces couleurs sont adaptés aux scènes naturelles. Ils ont été établies par la CIE(Commission Internationale de l’Éclairage). Les plans cadastraux anciens sont des documents très particuliers qui nécessitent des espaces dédiés.
Espaces couleurs : « entraînés » • Les espaces hybrides • L’espace des systèmes d’axes indépendants(ACP) • Espaces « Artificiels » apprentissage par algorithme génétique.
Doit on travailler en une dimension ? PC1. L’espace des systèmes d’axes indépendants • Vecteurs Propres de l’ACP sur une image: • PC1 = Représente la luminance. • PC2 = Quant à l’axe PC2, il sépare la couleur bleue de la couleur rouge, en d’autres termes, il représente l’axe Bleu–Rouge, le coefficient vert étant négligeable. • Otha et al : Approximation de la transformée de Karhunen-Loeve : • Analyse en Composantes Principales : • PC1 : 95,26% • PC2 : 04,16% • PC3 : 00,57%
Les espaces hybrides • Les espaces hybrides décorrélés. • 1. Matrice de covariance de l’ensemble des composantes disponibles (R,G,B,L,a*,b*,I1…) • 2. ACP de la matrice de covariance • 3. On ne garde que les 3 composantes les plus significatives. • J. D. Rugna, P. Colantoni, and N. Boukala, “Hybrid color spaces appliedto image database”
Les espaces hybrides • Nombre de combinaisons : • Notre critère de « bon » espace hybride: • Espace qui maximise un taux de reconnaissance. • La méthode • Faire les 13800 possibilités. • Utiliser un algorithme génétique. • S’affranchir des combinaisons absurdes. • p = 3, le nombre d’expériences, nombre de composantes de notre espace. • n = 25, le nombre de composantes disponibles.
Population • Une population : Un ensemble d’espaces hybrides. • Un individu : Un espace hybride. • Un gène : Une composante.
Initialisation • Première population initialisée aléatoirement. • Tirage aléatoire dans l’ensemble des composantes disponibles. • Soit C l’ensemble des composantes. • C = {R,G,B,L,a*,b*,u’,v’,….} • Card(C) = 25.
Cross Over • Soit 2 individus h1 et h2 : Génération parent Génération enfant
Mutation • Soit un individu h1 Génération parent Génération enfant Tiré aléatoirement
Fitness • Taux de reconnaissance • Classification K-PPV • Supervisé
Selection • Maximiser le taux de reconnaissance. • Algorithme élitiste.
Application • L’AG est utilisé ici comme un outil de sélection de caractéristiques. • Nous appliquons cet algorithme à une image dont nous connaissons la vérité terrain.(Apprentissage) • Puis nous appliquons l’espace trouvé sur une autre image(validation).
Espaces « Artificiels » apprentissage par algorithme génétique.
Principe et Objectif • Nous cherchons donc les coefficients de la matrice W qui maximisent le taux de reconnaissance obtenu par un classifieur KPPV. • Apprentissage des coefficients de matrice W. Rs = a11*R+a12*G+a13*B
Problèmatique • La question tourne donc en un problème d’optimisation. • Le critère (taux de reconnaissance) n’est pas analytiquement calculable et n’est pas continûment dérivable. • Nous optons pour une optimisation utilisant les algorithmes génétiques
Population • Une population : Un ensemble de matrices. • Un individu : Une matrice. • Un gène : une ligne(vecteur) d’une matrice.
Initialisation • Première population initialisée aléatoirement. • Chaque coefficient se voit attribué une valeur aléatoire compris dans l’intervalle [-1 ; 1].
Cross Over • Soit 2 individus w1 et w2 : Génération parent Génération enfant Où e1 est le vecteur ligne [a1i]
Mutation • Soit un individu W1 Génération parent Génération enfant Généré aléatoirement
Fitness • Taux de reconnaissance • Classification K-PPV • Supervisé
Selection • Maximiser le taux de reconnaissance. • Algorithme élitiste.
Etude des clusters • L’indice silhouette moyen est augmenté. • Il passe de 0.60 en RGB à 0.64 dans ce nouvel espace.
Application • Nous appliquons cet algorithme à une image dont nous connaissons la vérité terrain.(Apprentissage des coefficients) • Puis nous appliquons la matrice obtenue(meilleur individu) sur une autre image(validation).