530 likes | 594 Views
Hervé Goëau. Structuration de collection d’images par apprentissage actif crédibiliste . 25 mai 2009. Motivations. Valoriser des fonds de collections d’images Contexte INA : Photothèque Contexte « grand public » : collections personnelles de photographies. Plan Introduction
E N D
Hervé Goëau Structuration de collection d’images par apprentissage actif crédibiliste 25 mai 2009
Motivations • Valoriser des fonds de collections d’images • Contexte INA : Photothèque • Contexte « grand public » : collections personnelles de photographies Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion Bateaux Plage Montagnes Famille
Systèmes existants • Manuel • +expressivité, ergonomie • - fastidieux • Automatique • + productivité • -satisfaction • Semi-automatique • + expressivité, contrôle utilisateur • - peut être fastidieux Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion
Objectifs et contraintes • Semi-automatique • Collections vierges • Satisfaction totale de l’utilisateur • Capturer ses intentions • Diminuer sa charge de travail • Une ou plusieurs catégories par image Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion
Proposition Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion Utilisateur Choix d’une stratégie de sélection Interactions Sélection active d’images Etats de connaissance Modélisation et synthèse de la connaissance Interface homme machine Liste(s) d’images Images non étiquetées Images étiquetées Etiquetages Nouvel état des étiquettes
Modélisation et synthèse de la connaissance Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion
Problématique Ø ? Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion « éléphants » ? ? ? « plages » « monuments »
Contenus visuels Non étiquetée u Étiquetéelq Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion Descriptions couleurs, orientations Croyance que u appartient à la même classe de lq? Fossé sémantique? Appartenances multiples? Combinaisons ?
Fonction de croyances (1/3) Modèle des Croyances Transférables [Smets94] Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion Cadre de discernement : Espace puissance : conflit doute Distribution de masses (KnnEv [Denoeux95]) :
Fonction de croyances (2/3) Adaptation locale des fonctions de croyances Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion Knn « négatifs » Paramètre f : croyance aux frontières des classes
Fonction de croyances (3/3) Paramètre f : gestion des croyances aux frontières des classes Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion u
Combinaison de témoignages • Règle de combinaison conjonctive Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion • Problème : masse sur la proposition ?
Transfert de masses Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion
Multi-classe • produit des cadres de discernement « locaux » • Exemple pour 2 classes : 4 hypothèses • Combinaison des distributions de masses l’opérateur « d’extension vide » [Smets93] Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion
Multi-descripteur Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion
Modélisation de la connaissance : bilan • Extension du KnnEv • connaissance détaillée : • Appartenance une ou plusieurs classes • Non appartenances • Doutes et conflit • Adaptation locale Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion
Sélection active d’images Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion
Apprentissage actif Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion « Vérité terrain » Modèle idéal t0 • Classer les échantillons les plus « informatifs »
Apprentissage actif Stratégie 1 Stratégie 2 Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion t0 t1 t2 t3 t4 • Classer les échantillons les plus « informatifs » • Pour l’apprentissage • Pour l’utilisateur Adéquation ?
Stratégies de sélections Transformation pignistique [Smets05] Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion Hypothèses : - positives - rejet en distance - ambigües locales globale
Stratégie du plus positif Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion Recherche des étiquettes les plus probables Premiers sélectionnés Derniers sélectionnés
Stratégie du plus rejeté en distance Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion Exploration de nouveaux contenus visuels Premiers sélectionnés Derniers sélectionnés
Stratégie du plus localement ambigu Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion Désambigüisation des classes 2 à 2 Premiers sélectionnés Derniers sélectionnés
Sélection active d’images : bilan Expression des stratégies usuelles avec le MCT Stratégies complémentaires pour identifier et cerner les classes Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion
Interface homme-machine Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion
Proposition automatique d’étiquette(s) Exemple à 3 classes Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion Etiquetage sans rejets Etiquetage avec rejet en distance Etiquetage avec rejet en ambigüité ou étiquetage multiple sans rejets Etiquetage avec rejets ou étiquetage multiple avec rejet en distance
Interface et démonstration Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion
Evaluations Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion
Classification automatique et multi-étiquetage scene-classification [Boutell04] 6 classes Corel 1,08 étiquettes/image 1211 apprentissage / 1196 test Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion
Caractérisation des stratégies (1/3) 5x100 images Corel Classes visuellement homogènes Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion Effort de l’utilisateur Nombre final de mauvaises propositions Evolution
Caractérisation des stratégies (2/3) Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion f = 0,4
Caractérisation des stratégies (3/3) Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion f = 0,7
Combinaison avec des métadonnées Combinaison avec des informations imprécises et partielles Ex : date de prise de cliché Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion 1820 photographies, 24 appareils, 6 événements temporels Préparatifs Séance photos Mairie Cérémonie Soirée Lendemain
Combinaison avec des métadonnées Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion
Evaluation avec utilisateur • Documentaliste responsable de la Photothèque Ina • Méthodologie « penser à haute voix » [Nielson92] • Téléfilm Borgia • ↗ Une même classe avec contenus visuels différents • ↗ Réorganisation à volonté des classes • ↗ Prise en main de l’interface • ↗ Adéquation avec usage • ↘ Prise en main des stratégies non immédiate • Suggestions : • Vue d’ensemble pour initialisation des classes • Hiérarchie Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion
Conclusion • Verrous levés : • Satisfaction totale • Peu d’échantillons • Multi-étiquetage • Tout type de collections d’images • Cadre de formalisation : • Classification, stratégies, décisions • Modélisation du doute et du conflit • Echelle • Souplesse : • Gestion des classes : modification/création/suppression à la volé • Ajout de nouveaux descripteurs de contenus et métadonnées • Prototype : tests opérationnels Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion
Perspectives (1/3) • Optimisations et autres tests : • Adaptation automatique des fonctions de croyances • Descripteurs (locaux) et métriques • Classifieurs de base • Semi-supervisé : • Structuration partielle de très grandes bases d’images • Structuration de vidéos Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion
Perspectives (2/3) • Combinaison/alternance de stratégies • plus de propositions correctes • améliorer le confort de l’utilisateur Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion 1 MR, X MP
Perspectives (3/3) • Organisations hiérarchiques • Formalisation de « sur-classes » et « sous-classes » • Multi-étiquetage sur différents niveaux hiérarchiques Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion
Merci pour votre attention Plan • Introduction • Modélisation de la connaissance • Sélection active d’images • Interface et démonstration • Evaluations • Conclusion
DESCRIPTEURS MPEG7 (1/2) 5x100 images Corel Descripteurs standards (Rummager ) Stratégie du plus rejeté en distance MR k=5,f=0.7,distance de Bhattacharya Descripteur Nombre de corrections final Hrgb 33 Hhsv 33 Cced 35 Scd 35 Cfct 37 Hlab 39 Hluv 46 Horient 54 MPEG7cld 58 MPEG7ehd 68 MPEG7scd 399
DESCRIPTEURS MPEG7 (2/2) 5x100 images Corel Descripteurs standards (Rummager ) Stratégie du plus rejeté en distance MR k=5,f=0.7,distance de Bhattacharya
Transformation d’étiquettes PT3 PT4 PT6