590 likes | 760 Views
Thierry Lafouge Thierry.lafouge@univ-lyon1.fr Université Claude Bernard Lyon1 Laboratoire URSIDOC http://docsi.univ-lyon1.fr/. Applications des lois infométriques en science de l’information. Dualité,champ infométrique d’usage et de production.
E N D
Thierry Lafouge Thierry.lafouge@univ-lyon1.frUniversité Claude Bernard Lyon1Laboratoire URSIDOChttp://docsi.univ-lyon1.fr/ Séminaire Lirdhist 11janvier
Applications des lois infométriques en science de l’information Dualité,champ infométrique d’usage et de production. Du bon usage des mathématiques en science de l’information Séminaire Lirdhist 11janvier
Contexte • ISI (1955) • Scientométrie (1970) • Bibliométrie (1969) • Infométrie (1980) • X métrie Séminaire Lirdhist 11janvier
Domaines de recherche • Infométrie mathématique • Modèles de circulation des documents • Distribution<->Théorie de l’information(TMC :Shannon) • Scientométrie: usage des périodiques scientifiques • Webométrie : structuration de corpus sur le web Séminaire Lirdhist 11janvier
Infométrie mathématique • Régularités statistiques observées • Lois puissances (Inverse power law) • Usages: circulation des documents Séminaire Lirdhist 11janvier
Régularités statistiques observées • Sources items • Chercheurs produisent des articles(Lotka) • Revues éditent des articles (Bradford) • Mots produisent des occurrences (Zipf) • Ouvrages produisent des emprunts • Articles produisent des commandes Séminaire Lirdhist 11janvier
Régularités statistiques observées Séminaire Lirdhist 11janvier
Régularités statistiques observées • Bibliométrie distributionnelle • (fréquence - effectif) Séminaire Lirdhist 11janvier
Régularités statistiques observées • Loi de Lotka (fréquence - effectif) • En 1926 Lotka observe une régularité entre le nombre de publications dans un domaine scientifique et le nombre de ses membres. Séminaire Lirdhist 11janvier
Régularités statistiques observées • Loi de Bradford (rang-fréquences cumulées) • En 1934 bradford pour résoudre le problème du « chaos documentaire »de la littérature scientifique observe une régularité de la répartition des articles dans les journaux selon leur aptitude à représenter un domaine scientifique. Séminaire Lirdhist 11janvier
Régularités statistiques observées • Loi de Zipf (rang fréquence) • En 1935 Zipf analyse des corpus de données textuelles et observe des régularités sur la fréquence des mots. Séminaire Lirdhist 11janvier
Lois Puissances Séminaire Lirdhist 11janvier
Lois puissances • Caractéristiques • Décroissance avec une longue queue • Distributions asymétriques • Concentration forte d’un coté, large dispersion de l’autre • Caractéristique du champ social • Il existe un petit nombre de chercheurs qui publient un grand nombre d’articles. • Présentes dans beaucoup d’autres domaines • épidémiologie Séminaire Lirdhist 11janvier
Lois puissances • Propriétés mathématiques • Pas de moments d’ordre n < a • Invariance d’échelle • Lien avec la théorie de l’information • (Loi du moindre effort :fonction d’effort) Séminaire Lirdhist 11janvier
Lois puissances • Robustesse de la loi de lotka • Probabilité de publier n articles sachant que les chercheurs publient x articles en moyenne • Poisson Séminaire Lirdhist 11janvier
Lois puissances • Modèle Probabiliste • Loi de Pareto Séminaire Lirdhist 11janvier
Lois puissances • Modèle probabiliste • Modèle de l’Urne de Polya • Le succès engendre le succès • Le résultat de Price de 1976 • Loi des avantages cumulés • Comportement asymptotique = loi puissance Séminaire Lirdhist 11janvier
Une autre approche • Quelques questions • Lien entre comportement social et description statistique ? • Échec = Non évènement • Prendre en compte le paramètre « No Use » • Processus discret / continu Séminaire Lirdhist 11janvier
Usages • Deux caractéristiques • Croissance de la quantité d’information • Mesure : augmentation de la littérature scientifique • Obsolescence de l’information • Mesure : taux de citation d’un article • La demi vie de citation d’une revue(indicateur ISI) • Mesure : % du fonds actif Séminaire Lirdhist 11janvier
Usagescirculation des documents • Exemples • Circulation des ouvrages dans une bibliothèque • Commandes des articles chez un fournisseur de documents • Téléchargements de documents Séminaire Lirdhist 11janvier
Usages paramètres de circulation des documents • Corpus • Temps • Durée d’observation • Fréquence d’observation • Prise en compte des « No use » • Fi : i =0,1,2……..imax, nombre d’ items demandés i fois Séminaire Lirdhist 11janvier
Emprunts livres : Bibliothèque Bordeaux Collection Payot Science 1984 Séminaire Lirdhist 11janvier
Commandes articles-InistParfums cosmétique Corps gras 1985 Séminaire Lirdhist 11janvier
Usage / Productiondualité Séminaire Lirdhist 11janvier
Séminaire Lirdhist 11janvier Tableau - 2 – Commandes des revues à l’Inist durant la première semaine de janvier 1997
Usages : modèle mathématique • Modèle mathématique probabiliste • xt nombre de circulations pendant la période [o t] Xt processus connu pour un paramètre L Séminaire Lirdhist 11janvier
Usages : modèle mathématique • Lois de probabilité discrète • P : Processus Poissonien de taux L / fL fonction gamma -> Loi Binomiale négative Loi géométrique Séminaire Lirdhist 11janvier
Emprûnts livres – Bibliothèque Bordeaux Collection Payot Science 1984Ajustement par la moi binomiale négative Séminaire Lirdhist 11janvier
Commandes Articles / Parfums cosmétique 1985Fonction Puissance Séminaire Lirdhist 11janvier
Usages commandesVolumes / Parfums cosmétique 1985Fonction Puissance Séminaire Lirdhist 11janvier
Usage : IPP ordre 2 • Sources : revues/articles Séminaire Lirdhist 11janvier
Usages : nombre d’articles revue- JCR /1999 Séminaire Lirdhist 11janvier
Usages : nombre d’articles produitsrevue- JCR /1999 Séminaire Lirdhist 11janvier
Usage champ infométrique Séminaire Lirdhist 11janvier
Usage champ infométrique • Analyse de la distribution de la demande • Les articles demandés (sources primaires) • Comptage au niveau des volumes (sources secondaires) Séminaire Lirdhist 11janvier
Commandes articles-InistParfums cosmétique Corps gras 1985 Séminaire Lirdhist 11janvier
USAGEmodèle mathématique • X (i) = probabilité pour qu’un volume soit demandé i fois • A(i) = probabilité pour qu’un article soit demandé i fois • Y( j) = probabilité pour qu’un volume ait j articles • po = probabilité pour qu’un article ne soit pas demandé • Gj(i) = probabilité pour qu’un volume ayant j articles soit demandé i fois Séminaire Lirdhist 11janvier
USAGEutilisation d’un modèle • Approche positiviste • Ajuster une distribution observée par une distribution théorique • Une autre approche Séminaire Lirdhist 11janvier
Approche positivisteAjustement d’une distribution statistique • Ajuster : pourquoi ? • Vérifier une loi • Modèle explicatif raisonnable • Ajuster : intérêt • Analyse prévisionnelle • Création d’indicateurs • Ajuster : comment ? Séminaire Lirdhist 11janvier
Commandes des Revues en chimie en 1985 Inist • Génie chimique 43 titres • Appliqués : 23 • Théoriques: 22 • Polymères 51 titres • Appliqués: 22 • Théoriques 29 • Matériaux construction 22 titres • Peintures et Vernis 10 titres • Bois et Papier 6 titres • Parfums,cosmétiques 13 titres Séminaire Lirdhist 11janvier
Questions posées • Revues appliquées • Un article leader • C’est moins vrai pour les revues fondamentales -> Créer des indicateurs Séminaire Lirdhist 11janvier
Réponses • Indicateur : • Indicateur Séminaire Lirdhist 11janvier
Réponses • Ajuster la courbe de distribution des volumes / connaissant la distribution des articles . • Proportion d’articles non demandés dans les volumes demandés • Répartition des articles dans les volumes • Modèles d’ajustement Séminaire Lirdhist 11janvier
Ajustement Parfums cosmétique Corps gras 1985 Séminaire Lirdhist 11janvier
Ajustement Indicateurs Séminaire Lirdhist 11janvier