250 likes | 334 Views
UE303.c : cours n°5 Conception de système d’information multimédia. Catalogues électroniques multimédias : performances. Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de recherche SITE – LORIA sahbi.sidhom@loria.fr. Promo. Master IST-IE 05/06. I. Catalogage électronique. Processus.
E N D
UE303.c : cours n°5Conception de système d’information multimédia Catalogues électroniques multimédias : performances Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de recherche SITE – LORIA sahbi.sidhom@loria.fr Promo. Master IST-IE 05/06
I.Catalogage électronique Processus
Principe • Les catalogues sont des listes de tous les documents conservés dans une unité d’information et présentés selon un ordre spécifique : • par auteur • par matière • par nom de lieu • par titre
Fonction • Un catalogue indique l’endroit où se trouve les documents cités, ce que ne fait pas généralement une bibliographie • Tout document entrant dans une unité d’information doit être inscrit à son catalogue
Procédés • Les catalogues peuvent se présenter selon trois (03) procédés : • Alphabétique (qui est le plus simple) • Systématique (ou méthodique), selon un plan de classement • Topographique, selon l’ordre du numéro d’identification des documents d’après lequel ils sont rangés physiquement dans les magasins
Présentation • Les fiches d’un catalogue peuvent être réunies en volumes imprimés qui ont l’avantage de pouvoir être distribués dans diverses unités d’information et auprès des utilisateurs pour faciliter les recherches • Avec l’automatisation (de bibliothèques, de centre Doc., de SI des entreprises), les catalogues sont (souvent) produits à partir d’une base de données lisible par ordinateur pour : • Créer des fiches • Produire des listes • Interroger et faire des recherches d’information
Catalogues collectifs • Les Ccoll. ressemblent dans une même liste les catalogues de plusieurs bibliothèques ou institutions. • Exemple aux USA : Il existe des catalogues collectifs de livres, par exemple : the national union catalog (NUC), liste cumulative des fiches de la Library of Congress avec d’autres bibliothèques des USA (qui depuis 1983 est accessible en ligne) • Exemple en France : en 1997, la BnF a créé sa bibliothèque numérique « gallica » avec 76 000 imprimés numérisés en mode image, 15 000 documents en mode texte, 30 000 images et 30H de son. (2 millions de lecteurs en 2004).
Catalogues commerciaux • Les Ccom. sont des listes de produits fabriqués ou distribués par une entreprise ou un groupe d’entreprises. • Ils donnent souvent une brève description des produits et leurs références. Il permettent de connaître la gamme des produits disponibles et de passer des commandes directement. • Exemple eBay : Fondé en septembre 1995, eBay (Nasdaq : EBAY) constitue la plus grande communauté d'achat et de vente de biens et de services en ligne. qui dit « biens et services » en IE…
Autres catalogues • Catalogue de bibliothèque • Catalogue de publications en série • Catalogue d’éditeur • …
Catalogue multimédia • L’orientation vers le multimédia permet de rajouter un nouveau ordre spécifique dans les catalogues : Types de document • Accès au document intégral (full document) : accès aux contenus des notices bibliographiques accès aux résumés accès aux annotations >> si présence d’un thésaurus : accès aux termes, thèmes et descripteurs
II.Catalogage électronique Recherche d’information Évolutions
Procédure de recherche sur un catalogue en ligne • Besoin(s) informationnel(s) • Traduction du besoin en un problème de recherche d’information • Formulation de la recherche : • Équations de recherche (attributs, valeurs) • Termes proposés : thésaurus en ligne • Termes libres : utilisateur, veilleur • Opérateurs • Extraction • Résultats intermédiaires et reformulations • validation
Mesures d’efficacité d’un SRI • L’évaluation des SRI consiste à mesurer divers paramètres qui expriment la plus ou moins grande capacité d’un système de retrouver les documents ou leurs références répondant aux questions posées • Le but de l’évaluation est de connaître l’efficacité du système : • La réponse est-elle aussi complète, exhaustive et pertinente que possible ? • À quelles conditions peut-on diminuer le coût et augmenter l’efficacité d’un tel système ? • Quels sont les avantages ? à préciser comment un tel système fonctionne ou à déterminer pourquoi il fonctionne à un tel niveau (limites)
D Documents non pertinents Corpus de documents C (silence) Documents pertinents A (réponse correcte reçue) Documents retrouvés B (bruit) Documents non pertinents D Principaux paramètres
Rappel et Précision • Le taux de rappel (ou d’exhaustivité) est la proportion de documents pertinents retrouvés par rapport à l’ensemble des documents pertinents présents dans la base • Le taux de précision ou de pertinence est la proportion de documents pertinents par rapport à l’ensemble des documents fournis par la recherche
Exemple • Si une base de données de 100 références (documents) avec 20 qui répondent à la question ; le système en retrouve 15, mais omet les 5 autres : • Le taux de « rappel » est de 15/20 (75%) • Les documents pertinents qui n’ont pas été retrouvés constituent ce que l’on appelle le « silence », 5/20 (25%) • Si une recherche donne 40 références en réponse à la question avec 15 documents pertinents, • Le taux de « précision » est de 15/40 (37,5%) • On appelle « bruit » les 25 documents non pertinents qui ont été fournis en même temps, 25/40 (62,5%)
Rappel 60% 30% 70% 30% Précision Courbe de performance
III.Facteurs calculables SRI et catalogues
Facteurs de mesure • Rappel • Précision • Bruit • Silence
Comment mesurer ? • Méthode : • Définition • Visualisation • Équation extraction e B A p p pertinence D C e
Synthèse des valeurs • Rappel = A / (A+C) • Précision = A / (A+B) • Bruit = B / (A+B) • Silence = C / (A+C) Application de la méthode :