280 likes | 453 Views
Décomposition des manuscrits anciens en traits Construction des codes book basée sur la coloration de graphes. Hani DAHER – LIRIS Veronique EGLIN-LIRIS Nicole VINCENT-LIPADE Stephane Bres -LIRIS Djamel GACEB-LIRIS. Contexte Caractérisation: Squelettisation
E N D
Décomposition des manuscrits anciens en traits Construction des codes book basée sur la coloration de graphes Hani DAHER – LIRIS Veronique EGLIN-LIRIS Nicole VINCENT-LIPADE StephaneBres-LIRIS Djamel GACEB-LIRIS
Contexte • Caractérisation: Squelettisation • Extraction et Sélection des Descripteurs • Classification en tables de similarités « codebooks » • Résultats et application • Conclusion Plan
Projet Graphem: « GraphembasedRetrieval and Analysis for PaleograpHic Expertise of Middle Age manuscripts ». • Projet pluridisciplinaire: IRHT, École des Chartes, LIFO Orléans, LIPADE Paris V, LIRIS • Objectifs: • Faire progresser la compréhension de l’évolution des formes de l’écriture pour la Paléographie • Créer des méthodes efficaces d’accès au contenu des manuscrits (Word-Spotting, Word-Retrievial). contexte Projet Graphem
Contexte Type de manuscrits Epoque Gothique 13ème siècle 15ème siècle Epoque Mérovingienne Renaissance 10ème siècle 751 Epoque Carolingienne
Contexte qualité des manuscrits Enchevêtrement des lignes Vieillissement de l’encre et papier Ecriture à la marge et/ou entre les lignes
Contexte Ordre des traits & densité de l’encre • De gauche à droite • Le premier trait est situé à gauche et puis les autre traits le suivent • Recherche de l’ordre des traits à partir de la densité de l’encre • Détermination des poser et lever de calames: • Au début du trait la densité d'encre est importante • au cours du tracé la densité devient moins importante • à la fin du trait la densité d'encre la plus élevée
Contexte Relation: épaisseur et décomposition des traits • Traits noires: • Entre -135° et 60° • Obéissent à la règle générale • Traits pointillés • Frontière entre les traits obéissent et non obéissent à la règle. • Traits rouges (Région hachuré): • Traits qui n’obéissent pas à la règle générale • Possibilité de déterminer la direction des traits. • difficulté de connaître la position de la plume au cours de la formation du tracé. • possibilité de connaître la position du bout de la plume sur le support
Aide des paléographes au: • Classement des manuscrits en familles de style. • Reconnaissance des manuscrits • Développement des méthodes de recherche d’occurrence de mots « wordspotting » • Notre contribution: • Décomposition des manuscrits en traits • Sélection des descripteurs compréhensibles pour les deux domaines informatiques et paléographiques. • Constructions des tables de similarités « code-book » à partir des traits • Calcul de la Similarité entre les code-books pour la classification • Utilisation des code-books pour la recherche des occurrences des mots dans les manuscrits Contexte Objectifs et contributions
Contexte • Caractérisation: Squelettisation • Extraction et Sélection des Descripteurs • Classification en tables de similarités « codebooks » • Résultats et application • Conclusion Plan
Caractérisation: Squelettisation Suivi du tracé et détection de l’axe médian (b) (a) • Méthode: • S’appliquer directement sur l’image en niveaux de gris • Offrir une robustesse aux dégradations • On a aussi constaté : • Des ressemblances morphologiques entre vaisseaux sanguins et traits manuscrits
Caractérisation: Squelettisation Suivi du tracé et détection de l’axe médian • Etape 2: • Carte de distance • Diffusion Etape 3: Extraction de l’axe médian (Xu). Rayon: carte des distances. Diffusion: meilleure représentation des traits • Etape 1: • Mise en évidence du tracé • Lissage Image Fusion de diffusion et T.D
Caractérisation: Squelettisation • Application de la méthode de (Frangi,1998): • Directement sur l’image en niveau de gris I(x) pour mettre en évidence le tracé par rapport au fond. • La nouvelle image subit un lissage gaussien pour enlever les discontinuités, trous, bruits et déformations. Etape 1: Approche de séparation fond-forme
Caractérisation: Squelettisation • Application de la transformé en distance sur F pour: • Déterminer automatiquement le rayon « distance par rapport au point contour le plus proche) de chaque point du tracé. • Bonne adaptation au changement d’épaisseur des traits. • Squelettisation par régularisation du gradient et diffusion ( LeBourgeois,2007) Etape 2: Squelettisation par diffusion
Caractérisation: Squelettisation Principe de suivi du tracé. Etape 3: Détection de l’axe médian • Détection automatique des points de départ. • Points rouges au début de chaque trait. • Ces points représentent le départ pour les suivi des traits.
Caractérisation: Décomposition des manuscrits en graphèmes Les trois points particuliers de découpage: Découpage du manuscrit en graphèmes
Caractérisation: Décomposition des manuscrits en graphèmes Illustration: Minimum local
Caractérisation: Décomposition des manuscrits en graphèmes Illustration: croisements et cas d’erreur
Contexte • Caractérisation: Squelettisation • Extraction et Sélection des Descripteurs • Classification en tables de similarités « codebooks » • Résultats et application • Conclusion Plan
Extraction et Sélection des Descripteurs Extraction des caractéristiques
Extraction et Sélection des Descripteurs Extraction des caractéristiques
Extraction et Sélection des Descripteurs 1 1 2 2 5 5 4 4 3 3 6 6 7 7 a) Découpage en graphèmes 4 3 1 2 b) Modélisation en graphe (graphème = sommet) 5 6 7 Image de manuscrit c) Coloration de graphe 3 Couleurs = 3 classes de graphèmes 1 3 5 7 d) Construction de code book 2 4 6 construction du codebook Par coloration de graphes(Gaceb et Eglin,2008) appliquée aux graphèmes caractérisés • Application optimisation d’un seuil de similarité • Descripteurs Sélectionnés • Seuil • Descripteurs Sélectionnés • Seuil
Extraction et Sélection des Descripteurs • Reconnaissance du style des manuscrits à partir des code books: Comparaison des codebooks
Contexte • Caractérisation: Squelettisation • Extraction et Sélection des Descripteurs • Classification en tables de similarités « codebooks » • Résultats et application • Conclusion Plan
Résultats et application • 10000 traits à partir de 20 pages de manuscrits du Moyen-âge (IRHT), 300 images à ce jour. Extraits de la base de test
Résultats et application Extrait: distances d entre les 12 pages Evaluation avec vérité de terrain sur une base de données de 300 manuscrits.(en cours 10000 images) La vérité terrain est établie par l’expertise des paléographes <<<<Bouton>>>> Comparaison des codebooks d=0.127 Page 1 Page 7 d=0.206 Page 2 Page 10
Contexte • Caractérisation: Squelettisation • Extraction et Sélection des Descripteurs • Classification en tables de similarités « codebooks » • Résultats et application • Conclusion Plan
Nouvelle méthode de découpage de manuscrits en graphèmes. • Construction d’un code book robuste en utilisant la coloration de graphes. • Création d’un prototype expérimental à l’usage des experts paléographes du projet GRAPHEM. • Word spotting (en cours) Conclusion