230 likes | 448 Views
Master 2 recherche en informatique. Parcours 4 Des données aux connaissances : apprentissage, modélisation et indexation des contenus multimédias et des données symboliques. Domaine. Des donn ées porteuses d’un sens complexe : Donn ées biologiques, médicales, génomiques
E N D
Master 2 rechercheen informatique Parcours 4 Des données aux connaissances : apprentissage, modélisation et indexation des contenus multimédias et des données symboliques
Domaine • Des données porteuses d’un sens complexe : • Données biologiques, médicales, génomiques • Textes, images, vidéos, sons, paroles, musique • Signaux, alarmes, messages • Fichiers, bases de données, logs
Domaine • Des traitements sur ces données • Décrire, modéliser • Classer, trier, ranger, organiser • Visualiser, naviguer • Rechercher, trouver, découvrir • Résumer, condenser, ré-organiser • Diagnostiquer, détecter, décider
Domaine • Un enjeu : • Des traitements sur le sens • Des traitements ont du sens
Tronc commun • Module ADM - Analyse des données et modélisations stochastiquesobligatoire • 1 module au choix entre • ASR - Introduction à l'algorithmique des applications et des systèmes répartis • OPT - Optimisation numérique et combinatoire
Modules spécifiques • ARD - Acquisition et représentation des données • AS - Apprentissage supervisé • DSS - Apprentissage sur des données séquentielles symboliques • FAV - Analyse des documents et des flux audiovisuels pour l'indexation • CDD - Gestion de larges collections de documents décrits
Une autre lecture • Traitements (apprentissage, statistiques) généraux • non supervisés - ADM • supervisés - AS • Données (acquisition, représentation) - ARD • Traitements spécifiques • Données symboliques (langue, génome…) - DSS • Données numériques (images, son…) - FAV • Grandes collections - CDD
Emploi du temps • Tronc commun : le jeudi, 10 semaines • ARD et AS : jusqu’à Toussaint • DSS, FAV, CDD : après Toussaint • BIBL, COLQ, META, RAS… • Stage
Planning de travail • 20 h de cours / module=> au moins 30h de travail à côté ! • Apprentissage des cours • Lecture d’articles, de livres, synthèses • Travaux expérimentaux • Programmation • Traitement et analyse de données
Évaluation • Tronc commun : examen écrit • 5 autres modules : contrôle continu • Exposé, compte rendu écrit • Sur articles • À partir du travail expérimental • Épreuve écrite
Pour démarrer ! • L’indexation multimédiaDescription et recherche automatiquessous la dir. de Patrick GROSHermès - Lavoisier • Documentation IRISA • Sur commande (mais cher : 95 EUR)
Et ensuite ? • Pattern Recognition and Machine LearningChristopher M. BishopSpringer
Et encore ? • Un atelier mathématique • Pour rediscuter des notions de bases utiles :fonctions, dérivées, intégrales, matrices, probabilités... • Pour faciliter un travail personnelCe n’est pas un cours de math ! • En fonction des disponibilités de l’animateur bénévole ! (2 à 4h / semaine)
Stages : quelles équipes ? • DREAM : diagnostic, raisonnement et apprentissage, modélisation • IMADOC : reco de documents, de l’écriture • LIS : systèmes d’information logique • METISS : signaux sonores et parole • SYMBIOSE : modèles biologiques, bioinfo • TEXMEX : multimédia, grands volumes
D’autres équipes… • BUNRAKU : graphique et réalité virtuelle • CORDIAL (Lannion) : dialogue oral homme machine • FLUMINANCE : analyse et contrôle de flux de fluides dans des séquences d’images • LAGADIC : robotique et vision • PILGRIM (Lannion) : bases de données, flou • SERPICO : organisation et coordination dynamique de complexes moléculaires • TEMICS : compression d’images, tatouage • VISAGES : imagerie médicale
Exemples de sujets • IMADOC • Introduction de mécanismes probabilistes dans un analyseur grammatical bidimensionnel • Commandes gestuelles avec prédiction de trajectoires graphiques • DREAM • Prise en compte de la qualité des données pour la fouille de données
Exemples de sujets • TEXMEX • Suivi de sujets d'actualité dans les flux télévisuels • Pour une navigation facile, pertinente et individualisée dans une base de documentaires vidéos • METISS • Analyse et modélisation statistique de l’interprétation de morceaux de musique
Contact • Patrick.Gros@irisa.fr • 02 99 84 74 28 • Site Web du master www.irisa.fr/master • Pages des modules • Mailing list • Également : adresse des enseignants