300 likes | 512 Views
Motbis. Paris, le 30 janvier 2007. Un langage documentaire. Au service de l’Education Nationale depuis 1989. Elaboré et maintenu par le SCEREN avec la collaboration d’enseignants, d’experts et de documentalistes. Histoire et collaborations….
E N D
Motbis Paris, le 30 janvier 2007
Un langage documentaire • Au service de l’Education Nationale depuis 1989. • Elaboré et maintenu par le SCEREN avec la collaboration d’enseignants, d’experts et de documentalistes.
Histoire et collaborations… • Motbis a été élaboré à partir de langages existants dans le système éducatif français - Thélyce, Mémobase - mais aussi à partir du vocabulaire Eudised (devenu depuis « Thésaurus Européen de l’Éducation ») ou les vedettes matières RAMEAU. • Motbis est le résultat d’un travail collectif du réseau SCEREN [CNDP-CRDP], relayé par des documentalistes de lycées et de collèges, mené également, lors de ses différentes versions, en collaboration étroite avec des partenaires extérieurs tels que le Centre national d’Études et de Formation de l’Enfance Inadaptée, l’Institut National de Recherche Pédagogique, le Centre National d’Études et de Ressources en Technologie Avancée, l’Ecole Supérieure de l’Education Nationale (ex-DPATE-D)le Réseau National de Ressources en Sciences Médico-Sociales, en liaison avec le Bureau Van Dijk et le cabinet Assistance et Techniques Documentaires
Rappel de définitions… Thésaurus • [1] Langage documentaire fondé sur une structuration hiérarchisée d’un ou plusieurs domaines de la connaissance et dans lequel les notions sont représentées par des termes d’une ou plusieurs langues naturelles et les relations entre notions par des signes conventionnels. [1] Association française de normalisation, Vocabulaire de la documentation . - Afnor, 1987 . - (Les Dossiers de la normalisation) ISBN 2-12-484221-8 • [2] Un thésaurus est une liste d’autorité organisée de descripteurs et de non descripteurs obéissant à des règles terminologiques propres et reliés entre eux par des relations sémantiques (hiérarchiques, associatives ou d’équivalence). Cette liste sert à traduire en un langage artificiel dépourvu d’ambiguïté des notions exprimées en langage naturel. [2] Association française de normalisation NF Z 47-100, décembre 1981. Règles d'établissement des thésaurus monolingues .In : Documentation. Tome 1 : présentation des publications, traitement documentaire et gestion de bibliothèques . - 6e édition . - Paris-La-Défense : Afnor, 1996 . - p. 478-480 : 8. Vocabulaire ISBN 2-12-234461-X
Depuis Motbis 2006 • Le thésaurus Motbis fait l’objet d’évolutions annuelles. Ses versions successives comportent désormais un millésime correspondant à l’année civile en cours • Le principe est de refléter le plus fidèlement possible l’évolution des connaissances dans un domaine, les intérêts et les besoins des usagers et de combler les lacunes conceptuelles et terminologiques qui peuvent subsister. • Cette version comprend également la correction des erreurs typographiques ou autres qui se sont insérées dans la version précédente du thésaurus. • La version 2007 ne propose pas, comme la version 2006, de nouveau subthésaurus spécialisé destiné à un public particulier. Mais l’articulation du noyau commun Motbis 2007 et du subthésaurus agricole Thesagri demeure.
Motbis 2007 Ses modifications consistent donc en : • l’ajout après examen, de nouveaux termes : descripteurs pour de nouveaux concepts nécessaires, non-descripteurs pour augmentation des entrées • l’ajout de relations associatives • la mise à jour des données concernant les identificateurs en liste annexe • le traitement des intitulés de certains descripteurs ambigus • la correction des erreurs résiduelles repérées (coquilles…) de la version 2006
Organisation actuelle Au sein de la division Ingénierie éducative et documentaire, le groupe de projet Motbis assure : • l’organisation et la programmation de la maintenance pour chaque nouvelle version • la rédaction des documents de travail et des documents de synthèse soumis aux différents intervenants du projet • l’intégrité et la cohésion du produit final • la coordination technique de la mise en production de la nouvelle version • la gestion et la mise à jour du site www.motbis.fr • l’actualisation de l’interface de consultation en ligne de Motbis
Un comité d’orientation et des groupes de travail • Le comité d’orientation MOTBIS a un rôle scientifique de validation des objectifs et du contenu conceptuel et terminologique des versions du thésaurus • Il se réunit 2 fois par an : • pour validation des objectifs de la nouvelle version • pour relecture et validation finale du contenu • Il est composé de personnes – ressources utilisateurs potentiels de la nouvelle version en développement. • Les membres représentants du réseau SCEREN ont une voix participative (décisionnelle) en tant que copropriétaires du thésaurus : • Représentant de l’Interacadémique d’Ile-de-France : Marie- France Brézault • Représentant de l’Interacadémique du Nord Est : Isabelle Berteloot • Représentant de l’Interacadémique d’Outre-Mer : Claudette Braconne (éventuellement remplacée par Frédérique Péaud) • Représentant de l’Interacadémique de l’Ouest : Marie-Hélène Grisaud (éventuellement remplacée par Michèle Briziou ou par Séverine Autret) • Représentant de l’Interacadémique du Sud Ouest : Dominique Tascher • Représentant de l’Interacadémique du Sud Est : Claudine Vidal (éventuellement remplacée par Anne Bernardini ou Carmela RIGOUT) • Membres de la Direction des Ressources et des Technologies : • Jérôme Bertonèche (Directeur-Adjoint) • Térésa Brémand (Groupe de projet) • François Feyler (Groupe de projet) • Sandrine Jambert (Groupe de projet) • Les membres suivants ont une voix consultative : • Expert : Sylvie Dalbin (Assistance & Techniques documentaires) • Représentant de l’ENESAD-CNERTA : Katell Collet • Représentant du CNED : Marie-Claire Gravey • Représentant de l’ESEN : Nicole Siebert-Taabni • Représentant IUFM : Anne Lehmans (IUFM d’Aquitaine) • Représentant CDI Collège : Sabine Dosière (Collège Pablo Neruda – Wattrelos) • Représentant CDI Lycée : Jean-Marc Rochette (LEGT – LEP Jacob Holtzer – Firminy) • DRT : Sylvie Moussaoui
Chaque membre du comité d’orientation a en charge de : • lire tous les documents préparatoires aux réunions et faire part de ses commentaires éventuels • donner son avis sur les objectifs proposés pour la nouvelle version, notamment par rapport aux attentes des usagers potentiels quant au contenu du thésaurus • donner son avis sur les propositions pour la nouvelle version émanant du groupe de projet • valider les modifications apportées à la nouvelle version • rédiger des propositions alternatives le cas échéant • avant la production finale du thésaurus relire et vérifier l’orthographe, la forme des termes, l’intégrité des termes
Quelques orientations: • En continuité avec les objectifs de la version 2006 de Motbis, le travail de désambiguïsation des descripteurs doit être poursuivi. • Pour lever l’ambiguïté de deux homonymes, il semble essentiel d’ajouter un qualificatif à chacun des termes homonymes. L’absence de qualificatif à l’un des termes laisse toute l’ambiguïté à ce concept pour un utilisateur ne connaissant pas (ou ne songeant pas à) l’existant du 2ème homonyme. • Sur le choix du terme préférentiel, la notion de terme précis est apparue dans le sens de terme le plus juste. Ce terme peut être le terme scientifique, le terme courant ou vernaculaire. Le choix du concept le plus usité et du terme le plus usuel semble le plus opportun.
En 2007 Ajout de relations associatives pour Motbis 2007 l’ajout de relations associatives concerne plus particulièrement les champs sémantiques suivants : • 1135 phénomènes naturels et physiques • 1310 physique • 1325 éléments et composés chimiques • 1535 accidents et maladies • 3335 machines et éléments de machines • 3505 technologie
Les candidats descripteurs proposés pour la version 2007 sont le résultat de la collecte • du champ mots-clés libres des bases internes au réseau SCEREN : BNPR, Callimaque, Educasources, @doc, … • des propositions issues du travail de conception d’OTAREN • des suggestions reçues via le site motbis.fr • des suggestions reçues via les listes de diffusion
Quelques critères : • Seuls les termes qui représentent nécessairement de nouvelles notions peuvent être ajoutés. • Les termes nouveaux exprimant des notions déjà présentes dans le thésaurus doivent figurer en non descripteur. • Les termes nouveaux qui expriment des notions plus spécifiques doivent figurer également en non descripteurs (tout au moins pour le noyau commun) • Toutefois si la liste de non descripteurs grossit considérablement, on peut envisager après réflexion, l’ajout de descripteurs plus spécifiques.
Les types de modification possibles : • la modification simple d’un descripteur, sans implication pour la structure conceptuelle du thésaurus : le nouveau descripteur représente la même notion que l’ancien • la transformation d’un descripteur en non descripteur : il est nécessaire d’analyser les relations sémantiques établies pour l’ancien descripteur, pour évaluer leur pertinence en rapport avec le nouveau descripteur. • Mais lorsqu’un nouveau terme est ajouté au lexique, on doit immédiatement apporter les corrections nécessaires à tous les descripteurs auquel il est relié sémantiquement ( liens d’équivalence (EP/EM), hiérarchique (TG/TS) ou associatif (A TA de B, B TA de A) • La suppression totale d’un descripteur n’est possible que lorsqu’il est certain que ce descripteur n’est utilisé ni pour l’indexation ni pour la recherche. On doit s’assurer auparavant que la non utilisation du terme n’est pas due à un défaut structural du thésaurus (un descripteur orphelin utile peut-être oublié), un problème de niveau d’indexation, ou de lien sémantique mal construit. Si un descripteur est superflu, il est recommandé de le transformer en non descripteur
La sélection des descripteurs et des non-descripteurs se fait en fonction des critères suivants : • Caution bibliographique : la fréquence d'utilisation du terme dans la littérature ; les documents à traiter. • Caution de l’utilisateur : la fréquence d’utilisation du terme dans les questions. • Caractère univoque de la représentation du concept : un descripteur ne doit représenter qu’un seul concept et réciproquement un concept ne doit être représenté que par un descripteur unique. Il faut éviter les termes ambigus ou polysémiques. • Compatibilité structurelle : la facilité d'intégration du terme dans la structure existante (réseaux sémantiques, forme du terme…). • Utilisation courante : le terme choisi doit être de préférence d'usage courant si il est précis et non ambigu. • Cohérence : utiliser toujours le même type de terme pour représenter les concepts et privilégier le même niveau de langage. • Indépendance contextuelle : la capacité d'un terme pour représenter une réalité sans l'aide d'un contexte
La forme des termes à sélectionner doit respecter les règles suivantes • Nature grammaticale : substantif (éducation) ou groupe de mots (effet de serre). • Langue : français ou termes d’emprunt à usage courant (camping) si un terme d’emprunt est plus en usage que sa traduction française, il peut-être utilisé comme descripteur et son équivalent français comme non descripteur (arte povera EP art pauvre, CD-ROM EP Disque Optique Compact). Si les formes française et étrangère sont toutes deux d’usage, on utilise la forme française en descripteur et la forme d’emprunt en non descripteur (coentreprise EP joint venture, stationnement EP parking). • Genre : de manière générale, les descripteurs sont au masculin, mais la forme féminine peut-être utilisée pour certaines catégories de termes désignant notamment les professions, les occupations, les activités (sage-femme). • Nombre : de manière générale, les descripteurs sont au singulier (adopter la forme d’entrée proposée par les dictionnaires). Utiliser le pluriel lorsque le terme n’existe qu’au pluriel dans les dictionnaires ou que son sens diffère s’il est au pluriel (arts martiaux, travaux publics, beaux arts, fouilles archéologiques). • Orthographe : utiliser la forme la plus communément admise, renvoyer l’autre en non descripteur (paiement EP payement). • Niveau de langue : on choisit de préférence la forme d’un terme qui correspond au niveau de langue commun aux usagers. Il faut éviter les formes trop familières, l’argot et le jargon. • Abréviations et acronymes : l’abréviation et l’acronyme sont acceptés comme descripteur s’ils sont universellement connus et utilisés. Un renvoi est établi systématiquement vers le nom complet (ADN EP acide désoxyribonucléique, SIDA EP syndrome de l’immunodéficience acquise, UNESCO EP United Nations Educational, Scientific and Cultural Organization). • Ponctuation : apostrophe et traits d’union sont conservés (main-d’œuvre, non-violence). On élimine le trait d’union dès qu’une source reconnue en donne l’autorisation. Il faut alors prévoir l'autre forme en non descripteur • Homographie et polysémie : homographie et polysémie doivent être différenciées par l’ajout d’un qualificatif (cousin : parent, cousin : insecte).
http://www.motbis.fr • Créer une communauté d’utilisateurs • Proposer des services d’accompagnement • Offrir une modalité de consultation • Communiquer avec le groupe projet • Rendre visible l’activité de conception et de maintenance • Participer à la création du thésaurus
Quelques pistes de réflexion • Illusion de l’exhaustivité d’un thésaurus (« encyclopédique ») généraliste des contenus de l’enseignement général … • Illusion de l’objectivité, un thesaurus est toujours une représentation du monde • La difficulté de réactivité, de consensus sur les termes • Les écarts entre prescriptions et usages réels
Entre la continuité et la mutation • Connaître les usages réels • Améliorer sans révolutionner • Trouver de nouvelles formes de collaboration pour le suivi et les ajouts • Analyser l’existant, expérimenter et réfléchir à l’ avenir • Se placer dans une perspective d’interopérabilité terminologique
Expérimentations pour Motbis 2008 • Trois orientations possibles à experimenter: • Orientation 1- Outils de recherche adaptés, distincts de l’outil d’indexation Certains publics de Motbis n’utilisent pas de thésaurus pour trouver des documents. Il conviendrait donc de développer, à partir du même réservoir terminologique et sémantique, des outils de recherche adaptés pour leur permettre d’atteindre leur but : trouver les documents les plus pertinents. • Orientation 2 – Des langages spécialisés adossés à Motbis En tant que « langage spécialisé dans le domaine éducatif et représentatif des sciences de l'éducation et des contenus de l'enseignement général français », Motbis n’intègre pas l’ensemble des concepts spécialisés, utiles à tous ses publics, au degré de précision voulu. De plus, sa structure globale (la liste des champs sémantiques) constitue une table de matières difficile voire impossible à utiliser dans des secteurs spécialisés et/ou professionnels, à la recherche documentaire mais également à l’indexation. • Orientation 3 – Un langage polyhiérarchique Un thésaurus polyhiérarchique semble plus efficient qu’un thésaurus monohiérarchique. Un thésaurus monohiérarchique en obligeant l’utilisateur à aller consulter plusieurs domaines en parallèle, semble complexifier sa tâche.
Hypothèse 1.Langage d’indexation/ langage d’interrogation • Une recherche documentaire est plus performante (efficiente) lorsqu’elle est conduite avec un outil de recherche adapté à l’interrogateur (non-indexeur) qui effectue l’interrogation, en lieu et place de l’outil d’indexation. Il ne s’agit pas ici de monter une expérimentation pour chacun des différents publics de Motbis, ni de définir précisément ce que serait un tel outil pour chacun des publics, mais de démontrer la pertinence du principe même de développement d’un outil d’interrogation distinct de l’outil d’indexation. L’expérimentation aura lieu en « laboratoire ». Cette expérimentation doit prendre appui sur deux cas de figure précis : Cas1. Interrogation d’une base constituée de notices provenant de plusieurs sources, indexées avec des langages distincts Cas2. Interrogation simultanée de bases documentaires indexées par des langages différents (interrogation multisources) • Un travail parallèle OTAREN
Hypothèse 2 : des langages spécialisés adossés à Motbis • L’indexation et la recherche documentaires dans un environnement spécialisé (agriculture, informatique, santé…) sont d’autant plus efficaces que le langage d’indexation et/ou d’interrogation est spécialisé. • Si cette hypothèse était validée, il resterait à étudier, la solution technique à retenir pour construire ces langages spécialisés à partir de Motbis. • Dans la situation actuelle, il est possible de conduire un retour d’expérience de l’utilisation de Thésagri (langage spécialisé dans le domaine de l’agriculture construit à partir de Motbis et en cours de déploiement dans les centres documentaires du réseau Renadoc). Cette enquête doit nous permettre d’évaluer la pertinence d’une telle solution à partir de Motbis.
Enquête : Travail sur le domaine de l’informatique Cette expérimentation vise à évaluer la pertinence d’un langage spécialisé suivant une autre solution technique. Nous partons de l’hypothèse qu’il est possible de construire une version de Motbis remodelée de façon que : • son « visage » (structure) soit accepté par un plus grand nombre d’utilisateurs • les sub-thésaurus spécialisés (ou branches spécialisées) qui resteraient à construire soient plus simples à développer. • Publics-cibles d’un langage spécialisé en informatique et télécommunications (Technologies de l’information), et publics-cibles non spécialistes, utilisateur d’un langage contrôlé issu du même domaine • Construire un « langage spécialisé » en informatique et télécommunications (technologies de l’information)
Hypothèse 3 Un langage polyhiérarchique • Cette hypothèse d’évolution est alimentée par les résultats des différentes enquêtes liées aux Orientations 1 et 2 : • Intérêt de la polyhiérarchie pour construire et exploiter des Motbis spécialisés (plus / moins facile) • Intérêt de la polyhiérarchie pour construire et exploiter des Otaren (plus / moins facile)
Pour ne pas conclure… Evoluer pour correspondre aux mutations des connaissances des usages des systèmes d’information