960 likes | 1.17k Views
Linguistique: discipline, sources et méthodologie de recherche d’informations en ligne. Caroline IMBERT – DDL/ Lyon 2 Lise HERZHAFT – Urfist de Lyon herzhaft@univ-lyon1.fr 24 Mai 2007. 1- La discipline: introduction. Sciences du Langage ou linguistique Objets d’étude : langage, langues
E N D
Linguistique: discipline, sources et méthodologie de recherche d’informations en ligne Caroline IMBERT – DDL/ Lyon 2 Lise HERZHAFT – Urfist de Lyon herzhaft@univ-lyon1.fr 24 Mai 2007
1- La discipline: introduction • Sciences du Langage ou linguistique • Objets d’étude : langage, langues • Une science récente • Productions documentaires en expansion
Linguistique ≠ Lettres; ≠ « Langues »; ≠ « grammaire ». Eviter les erreurs d’orientation et les idées reçues. • Matière pluri- et transdisciplinaire. De la description pure à la neurolinguistique, de la linguistique de terrain à la génétique des populations.
Importance des laboratoires. Etudiants: construire un réseau; Personnels: informer les étudiants de l’existence des laboratoires. • Importance de l’anglais. La visibilité internationale. • « L’officiel » et « l’officieux »
Utilisation de la documentation par les doctorants. Un exemple personnel • La LinguistList : un outil indispensable.
Répertoire des centres de recherche http://dr.education.fr:8080/annuaire/ListeEntite.jsp?entite=ur&sd=64&prov=ListeSd 77 centres 57 écoles doctorales en Sciences du langage : linguistique et phonétique générale 1-1 Centres de recherche français
1-1-2 Centres à Lyon, Grenoble 3 • EA 656 CENTRE DE RECHERCHE EN TERMINOLOGIE ET TRADUCTION (CRTT) [P] LYON 2 • UMR 5596 DYNAMIQUE DU LANGAGE (DDL) [P] LYON 2 • UMR 5191 INTERACTIONS, CORPUS, APPRENTISSAGE, REPRESENTATIONS (ICAR) [S] LYON 2 • EA 1663 CENTRE D'ETUDES LINGUISTIQUES [P] LYON 3 • EA 612 CENTRE DE DIALECTOLOGIE [P] • EA 609 LINGUISTIQUE ET DIDACTIQUE DES LANGUES ETRANGERES ET MATERNELLES [P]
2- Introduction : le contexte • Accroissement des ressources en ligne • Coûts de production de diffusion moindres • Diversité de supports : textuel, oral, visuel • Diffusion des thèses et de la recherche plus aisée, bases de preprint, développement des e-journals, mouvement des archives ouvertes institutionnelles • Développement de listes de discussion, de blogs • Explosion des ressources documentaires en ligne
2- Typologie des sources • Dictionnaires Encyclopédies yourdictionary.com lexilogos • Catalogues de bibliothèques collectifs/ spécialisés • BDD de références FRANCISLLBA MLA BL BLLDB • Bases de périodiques PIO PAO, CAIRN, PERSEE, JSTOR, MUSE, Année philologique • Textes numérisés , Frantext ABU cours conférences • Thèses Portail Sudoc, Linguist List, Dissertation abstracts • Documents en open access : répertoires ROAR, OAISTER,DOAJ, et dépôts HAL • Moteurs de recherche Google Scholar, Scirus, In extenso • Associations, blogs Linguist List • Logiciels
3- Source fondamentale
3- Outils pour trouver des sources 3-1Linguist List donne accès à • People and Organizations : répertoire de linguistes et d’associations • Calls and Conférences 571 • Publications : 5869 livres, 1924 critiques, 1655 écrits universitaires, 1354 thèses résumées, 468 titres de revues, 438 éditeurs • Language Resources • Text & Computer Tools bibliographies, dictionnaires, corpus, logiciels, polices, aide à la citation de références • Teaching & Learning programmes, cours, exercices, ESL/EFL autres langues • Mailing Lists 90 sont regroupées • Search dans le site, les archives, les messages… • Jobs
3-2-1 Institut de linguistique française ILF • Site de l'INaLF et de l'ILF, Institut de linguistique française, proposant des données et ressources concernant la langue française tel Frantext, corpus de textes de la littérature française du XVI° au XX° siècle, soit 180 million de mots, consultable sur abonnement.Intérêt particulier : Dans la rubrique réservée aux abonnés mais en accès libre : le Catalogue critique des ressources textuelles sur Internet, pour aider les internautes à sélectionner les textes littéraires en langue française diffusés sur Internet. La mission de la fédération de recherche est d’assurer la structuration et le développement de la linguistique française.Il s’agit notamment :- d’unir des compétences et des ressources ;- de développer des programmes scientifiques fédérateurs ;- de produire des connaissances, des outils, des ressources ;- de définir des appels d’offres, des thèmes et des programmes dans le domaine de la linguistique française.Cette mission se réalise à travers les orientations mises en œuvre par le Comité de Direction .L’Institut de Linguistique Française a deux grands objectifs :1) une politique de ressources sur la langue française 2) une politique de soutien à des projets de recherche en linguistique française.1) L’Institut de Linguistique Française a pour objectifs la mise en commun, l’enrichissement et la valorisation de bases de données sur la langue française ; le développement de nouvelles bases ; la création et l’évaluation d’outils logiciels permettant l’exploitation et l’étiquetage des corpus .2) L’Institut de Linguistique Française a pour vocation de soutenir des projets de recherche mis en œuvre conjointement par plusieurs unités.Ces projets sont, d’une part, des recherches en linguistique française , et d’autre part, un siècle après l’Histoire de la langue française de Ferdinand Brunot, deux grandes entreprises de synthèse sur la grammaire du français.
3-2-2 Institut de la francophonie • http://francophonie-up.univ-mrs.fr/ • Nombreuses sources listées, organisées • Universités, centres de recherche et équipes • Ressources documentaires en ligne • Associations • Sélection de sites Autour de la francophonie mais aussi plus large
3-3 Autres outils • Signets de la BnF : sélection de vingt sites http://signets.bnf.fr/html/categories/c_410ling_assoc.html • Intutewww.intute.ac.uk Arts and Humanities/Linguistics liste de sites évalués • Album des sciences socialeshttp://album.revues.org/index153.html
Des portails généralistes MORESS CALAME • Moress Mapping Of Research in European Social Sciences and Humanities regroupe les ressources et les résultats de la recherche européenne www.moress.org • CALAME Répertoire (Institut des sciences de l’Homme Lyon)décrit 167 banques de données dont 22 bases de données en linguistique calame.ish-lyon.cnrs.fr
3-4 Outils collectifs ou non: quelques catalogues de bibliothèques • SUDOC www.sudoc.abes.fr et portail Sudoc http://www.portail-sudoc.abes.fr/ • Library of Congress www.loc.gov • KVK www.ubka.uni-karlsruhe.de/hylib/en/kvk.html • Bibliothèques nationales http://www.theeuropeanlibrary.org/ • Bibliothèques d’étude Rhône-alpes dont celle de l’ENS-LSH (fonds M Lejeune) http://mungo.grenet.fr/brainPortal/Brain_SearchSimple.jsp?startForm=simple&villeDef=RA&exec=oui&l
4- Sources : bdd de références • FRANCIS 1972-, 60 000 références, 91% articles, 1200 périodiques, collab AELIA, français 26%, gb 44%, alld 12% autres 8% • LLBA Linguistics and Language Behavior Abstracts 2000 périodiques, CR congrès, ouvrages 1973- résumé, mots-clés • MLA Modern Language Association 1923- 4 400 périodiques soit 1,7 million de références bibliographiques, pas de résumé, lien vers le texte • Bibliographie Linguistique BL 1993-
Méthodologie de recherche documentaire : rappel • Que, comment, où, pourquoi, pour qui … • Recherche du vocabulaire/ confrontation avec les listes de mots du vocabulaire contrôlé • Écrire une stratégie de recherche avec opérateurs, troncatures, recherche par champs • Se préparer à trop ou à trop peu de réponses • Les évaluer et évaluer sa recherche • Savoir récupérer les réponses dans un travail personnel • Aide à la recherche documentaire http://www.uhb.fr/urfist/Supports/RechInfoInit/Rechinfo1_cadre.htm
4-1 FRANCIS - Contenu • Base multidisciplinaire • 21 domaines dont Sciences du langage, de l’éducation, sociologie, philosophie, psychologie • Multilingue anglais, français, allemand, espagnol, italien russe , autres… • Découpée en 6 tranches chronologiques depuis 1984-
4-1 FRANCIS – Sciences du langage • Linguistique théorique, épistémologique, philosophie du langage • Linguistique descriptive : phonétique, phonologie, morphologie, syntaxe, lexicologie, sémantique, pragmatique (exclues : études de mots) • Linguistique appliquée traduction, lexicographie, traitements automatiques • Socio/ethnolinguistique • Sémiotique • Histoire de la linguistique • Physiologie / pathologie • Psycholinguistique • Études sur la communication et l’informationdu langage
4-1 FRANCIS - Contenu • Documents : 79% articles, 9% ouvrages, 7% thèses, congrès, 5% autres • Zones : Europe 43%, France 28%, USA 17%, Japon 1%, autres 11% • Langues : anglais 41%, français 31%, allemand 11%, italien 5%, espagnol 4% autres 8% • Couverture internationale, France et Europe prioritaires • 8000 revues recensées dont 1000 traitent de linguistique et 300 sont spécialisés
4-1 La recherche de références • A- Par les index • B- Directement dans les fenêtres de recherche simple ou avancée • Syntaxe mot in nom abrégé du champ • Exemple evaluation in de • Majuscules/minuscules sont indifférentes • Ne pas mettre d’accent sur les voyelles
4-1Page d’accès à la recherche simple dans FRANCIS Affichage d’index déconnexion limites Aides et guide de la base Recherche simple
4-1 Limiter sa recherche En haut à droite de l’écran de recherche Créer ou modifier supprimer Limite par sujet mots du titre noms d’auteurs Limites par des sous parties de la base
4-1Limites temporaires - accès par Liste déroulante à choix multiples Limiter au sous champ Linguistique
4-1 Recherche par les index Liste des 16 index interrogeables Interrogation par nom d’auteur Meirieu Meirieu
4-1 Recherche par fenêtre : 2 possibilités 1-Recherche ‘simple’ Recherche par nom d’auteur en précisant le champ Meirieu in au Lancer la recherche Lien vers la traduction anglaise ou des termes proches
4-1 Bouton ‘suggérer’ Terme recherché relation intersexe Aide plus ou moins pertinente à la recherche sémantique
4-1 FRANCIS 2- Recherche avancée Choix du champ de recherche Stratégie plus complexe Meirieu evaluation AUTHOR (AU) enseignement
4-1 Syntaxe 1 : les opérateurs • AND intersection • OR addition • NOT élimination • ADJ mots côte à côte dans l’ordre • WITH mots dans le même champ • NEAR dans une même phrase • In précise le nom du champ où le mot doit être cherché
4-1 Syntaxe 2 : divers • Pas d’accent ni de majuscule • Symboles, caractères spéciaux sont verbalisés • Troncatures * (0 à illimité) ?0 ou 1 caractère, peut se répéter dans un mot après un caractère • 6 mots vides and in near not or with
4-1 Syntaxe : les champs ‘descripteur’ • Descripteurs DE DEE DEF ODE • Vocabulaire contrôlé multilingue décrit synthétiquement le contenu des documents • DE contient tous les autres champs dans des paragraphes indépendants • Unitermes suivis d’un tiret ex : relation- • Expressions mots reliés par un tiret ex : enseignement-a-distance
4-1 Les réponses Cases à cocher pour garder ou envoyer par mèl les notices Réponse en texte intégral Se déplacer dans les réponses Rappel de la recherche Liens vers d’autres fournisseurs de texte intégral ou des sites web pertinents Lien vers la référence complète
4-2 LLBA Linguistics & Language Behavior Abstractshttp://www.csa.com/ Cambridge scientific abstract (1998-) 387 000 références issues de 1500 publications en série Résumés d’articles, critiques d’ouvrages, thèses, conférences • Depuis 1972 • 22 champs • Thesaurus en 3 langues services offerts : alertes ou DSI + références citées Lien avec psycArticles… récupération des données par mél ou impression
4-2 LLBA Linguistics & Language Behavior Abstracts • Mise à jour mensuelle / 14 000 par an • 8 types de publication : articles 72% critique de livre, film, logiciel 15% thèses 7% livres 1% chapitres de livres 5% communications de congrès <1% • 3 types de prises en compte Core Priority Selective
4-2 LLBA Linguistics & Language Behavior Abstracts • 45% de revues américaines • 5% Amérique centrale et sud • 44% Europe (est et ouest 40%) • 2% Australie Nouvelle Zélande • 4% Asie Moyen Orient, Afrique
4-2LLBA - Indexation • codes declassification de 28 champs et 102 sous champs - Classification numérique de 4 chiffres et par mots interrogeables • Thesaurus regroupant 3 700 descripteurs • Identifiants vocabulaire qui n’est pas dans le thesaurus - notions nouvelles, noms de langues ID
4-2 LLBA - Syntaxe d’interrogation • AND OR NOT () • WITHIN « X » NEAR 10 mots • * troncature illimitée interne ou à droite • ? Troncature limitée mais reproductible
4-2-1 Interface de recherche CSA 3 modes de recherche • Rapide recherche des mots comme une phrase, partout dans la référence • AVANCEE offre des choix de types de documents à rechercher et aide à écrire l’équation de recherche • Mode de commande pour les experts
4-2-1 CSA - Recherche par le thesaurus • Liste alphabétique des descripteurs • Liste hiérarchique (synonymes spécifiques génériques termes reliés) avec l’environnement, les notes d’application, le code du terme • Liste permutée • Possibilité d’explosion, de limite, d’utilisation du AND et OR booléens
4-2-1 CSA - Affichage des index • Liste alphabétique des termes de l’index d’un champ spécifique de LLBA • Utile pour les noms d’auteurs, de revues les types de documents, les langues • Possibilité de lancer la recherche par les commandes à gauche sur l’écran
4-2-1 CSA - Limiter la recherche • Par date pour tous les types de recherche • La dernière mise à jour • Les articles seulement • Les documents en anglais • Pour la recherche avancée et par commande • Tri des réponses par date ou pertinence
4-2-1 CSA - Les réponses • Hyperliens sur les noms d’auteur et les descripteurs • Lien vers la notice complète • Impression sauvegarde, envoi par mél export vers un logiciel de gestion bibliographique RefWorks ou au format Quickbib par défaut • Dé doublonnage possible
4-3 MLA Modern Language Association International Bibliography • 1923- • 2 millions de références en mars 2007 • 9 mises à jour annuelle +66 000 réf. • 4 400 publications en série, >1000 éditeurs, environ 100 sites web • 52 champs différents • 26 index affichables • 2 thesauri 45 000 termes et 327 000 noms • Si accès à JSTOR, texte intégral disponible • Nombreuses limites possibles
4-3 MLA typologie du contenu • Langues modernes, folklores, linguistique • Littératures et folklores du monde • Linguistique : théorie histoire linguistiques comparées, sémantique, stylistique, syntaxe traduction • Supports papier ou électronique • Bibliographies en ligne
4-3 MLA Limites pour la recherche • Dernière mise à jour • Articles • Anglais • Revue avec comité de lecture • Texte intégral par JSTOR • Type de publication (5) • Langue • Genre (11) • Siècle (1900-1999) Pour la recherche avancée quelle que soit la BDD Pour MLA
4-3 MLA - Réponses • Tri chronologique ou par pertinence • Affichages divers • Dé doublonnage possible • Hyperliens sur les auteurs et les descripteurs • Sauvegarde, impression, envoi par mél ou dans un logiciel de gestion de références
4-3 MLA Thesauri descripteurs/noms • 3 possibilités de recherche • Alphabétique • Hiérarchique (BT, NT, RT, UF) • Permutée Affichage des index : 26
4-3 MLA • KW cherche 3 champs simultanément TI, AB, DE • 5 Types de publication : livre 10% chapitre 19%, collection 1%, thèse 6%, article 64% • 295 langues sont indexées soit individuellement soit regroupées (Langues Bantoues, celtes, Micronésiennes…)