1 / 28

Hani DAHER – LIRIS Veronique EGLIN-LIRIS Nicole VINCENT-LIPADE Stephane Bres -LIRIS

Décomposition des manuscrits anciens en traits Construction des codes book basée sur la coloration de graphes. Hani DAHER – LIRIS Veronique EGLIN-LIRIS Nicole VINCENT-LIPADE Stephane Bres -LIRIS Djamel GACEB-LIRIS. Contexte Caractérisation: Squelettisation

lulu
Download Presentation

Hani DAHER – LIRIS Veronique EGLIN-LIRIS Nicole VINCENT-LIPADE Stephane Bres -LIRIS

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Décomposition des manuscrits anciens en traits Construction des codes book basée sur la coloration de graphes Hani DAHER – LIRIS Veronique EGLIN-LIRIS Nicole VINCENT-LIPADE StephaneBres-LIRIS Djamel GACEB-LIRIS

  2. Contexte • Caractérisation: Squelettisation • Extraction et Sélection des Descripteurs • Classification en tables de similarités « codebooks » • Résultats et application • Conclusion Plan

  3. Projet Graphem: « GraphembasedRetrieval and Analysis for PaleograpHic Expertise of Middle Age manuscripts ». • Projet pluridisciplinaire: IRHT, École des Chartes, LIFO Orléans, LIPADE Paris V, LIRIS • Objectifs: • Faire progresser la compréhension de l’évolution des formes de l’écriture pour la Paléographie • Créer des méthodes efficaces d’accès au contenu des manuscrits (Word-Spotting, Word-Retrievial). contexte Projet Graphem

  4. Contexte Type de manuscrits Epoque Gothique 13ème siècle 15ème siècle Epoque Mérovingienne Renaissance 10ème siècle 751 Epoque Carolingienne

  5. Contexte qualité des manuscrits Enchevêtrement des lignes Vieillissement de l’encre et papier Ecriture à la marge et/ou entre les lignes

  6. Contexte Ordre des traits & densité de l’encre • De gauche à droite • Le premier trait est situé à gauche et puis les autre traits le suivent • Recherche de l’ordre des traits à partir de la densité de l’encre • Détermination des poser et lever de calames: • Au début du trait la densité d'encre est importante • au cours du tracé la densité devient moins importante • à la fin du trait la densité d'encre la plus élevée

  7. Contexte Relation: épaisseur et décomposition des traits • Traits noires: • Entre -135° et 60° • Obéissent à la règle générale • Traits pointillés • Frontière entre les traits obéissent et non obéissent à la règle. • Traits rouges (Région hachuré): • Traits qui n’obéissent pas à la règle générale • Possibilité de déterminer la direction des traits. • difficulté de connaître la position de la plume au cours de la formation du tracé. • possibilité de connaître la position du bout de la plume sur le support

  8. Aide des paléographes au: • Classement des manuscrits en familles de style. • Reconnaissance des manuscrits • Développement des méthodes de recherche d’occurrence de mots « wordspotting » • Notre contribution: • Décomposition des manuscrits en traits • Sélection des descripteurs compréhensibles pour les deux domaines informatiques et paléographiques. • Constructions des tables de similarités « code-book » à partir des traits • Calcul de la Similarité entre les code-books pour la classification • Utilisation des code-books pour la recherche des occurrences des mots dans les manuscrits Contexte Objectifs et contributions

  9. Contexte • Caractérisation: Squelettisation • Extraction et Sélection des Descripteurs • Classification en tables de similarités « codebooks » • Résultats et application • Conclusion Plan

  10. Caractérisation: Squelettisation Suivi du tracé et détection de l’axe médian (b) (a) • Méthode: • S’appliquer directement sur l’image en niveaux de gris • Offrir une robustesse aux dégradations • On a aussi constaté : • Des ressemblances morphologiques entre vaisseaux sanguins et traits manuscrits

  11. Caractérisation: Squelettisation Suivi du tracé et détection de l’axe médian • Etape 2: • Carte de distance • Diffusion Etape 3: Extraction de l’axe médian (Xu). Rayon: carte des distances. Diffusion: meilleure représentation des traits • Etape 1: • Mise en évidence du tracé • Lissage Image Fusion de diffusion et T.D

  12. Caractérisation: Squelettisation • Application de la méthode de (Frangi,1998): • Directement sur l’image en niveau de gris I(x) pour mettre en évidence le tracé par rapport au fond. • La nouvelle image subit un lissage gaussien pour enlever les discontinuités, trous, bruits et déformations. Etape 1: Approche de séparation fond-forme

  13. Caractérisation: Squelettisation • Application de la transformé en distance sur F pour: • Déterminer automatiquement le rayon « distance par rapport au point contour le plus proche) de chaque point du tracé. • Bonne adaptation au changement d’épaisseur des traits. • Squelettisation par régularisation du gradient et diffusion ( LeBourgeois,2007) Etape 2: Squelettisation par diffusion

  14. Caractérisation: Squelettisation Principe de suivi du tracé. Etape 3: Détection de l’axe médian • Détection automatique des points de départ. • Points rouges au début de chaque trait. • Ces points représentent le départ pour les suivi des traits.

  15. Caractérisation: Décomposition des manuscrits en graphèmes Les trois points particuliers de découpage: Découpage du manuscrit en graphèmes

  16. Caractérisation: Décomposition des manuscrits en graphèmes Illustration: Minimum local

  17. Caractérisation: Décomposition des manuscrits en graphèmes Illustration: croisements et cas d’erreur

  18. Contexte • Caractérisation: Squelettisation • Extraction et Sélection des Descripteurs • Classification en tables de similarités « codebooks » • Résultats et application • Conclusion Plan

  19. Extraction et Sélection des Descripteurs Extraction des caractéristiques

  20. Extraction et Sélection des Descripteurs Extraction des caractéristiques

  21. Extraction et Sélection des Descripteurs 1 1 2 2 5 5 4 4 3 3 6 6 7 7 a) Découpage en graphèmes 4 3 1 2 b) Modélisation en graphe (graphème = sommet) 5 6 7 Image de manuscrit c) Coloration de graphe 3 Couleurs = 3 classes de graphèmes 1 3 5 7 d) Construction de code book 2 4 6 construction du codebook Par coloration de graphes(Gaceb et Eglin,2008) appliquée aux graphèmes caractérisés • Application optimisation d’un seuil de similarité • Descripteurs Sélectionnés • Seuil • Descripteurs Sélectionnés • Seuil

  22. Extraction et Sélection des Descripteurs • Reconnaissance du style des manuscrits à partir des code books: Comparaison des codebooks

  23. Contexte • Caractérisation: Squelettisation • Extraction et Sélection des Descripteurs • Classification en tables de similarités « codebooks » • Résultats et application • Conclusion Plan

  24. Résultats et application • 10000 traits à partir de 20 pages de manuscrits du Moyen-âge (IRHT), 300 images à ce jour. Extraits de la base de test

  25. Résultats et application Extrait: distances d entre les 12 pages Evaluation avec vérité de terrain sur une base de données de 300 manuscrits.(en cours 10000 images) La vérité  terrain est établie par l’expertise des paléographes <<<<Bouton>>>> Comparaison des codebooks d=0.127 Page 1 Page 7 d=0.206 Page 2 Page 10

  26. Contexte • Caractérisation: Squelettisation • Extraction et Sélection des Descripteurs • Classification en tables de similarités « codebooks » • Résultats et application • Conclusion Plan

  27. Nouvelle méthode de découpage de manuscrits en graphèmes. • Construction d’un code book robuste en utilisant la coloration de graphes. • Création d’un prototype expérimental à l’usage des experts paléographes du projet GRAPHEM. • Word spotting (en cours) Conclusion

  28. Merci de votre attention

More Related