340 likes | 449 Views
INF L14 Initiation aux statistiques 7 – Liaison entre variables quantitatives. Introduction. Jusqu’ici, examen d’une variable à la fois Statistiques univariées Mais on peut aussi regarder la relation entre deux variables Statistiques bivariées. Exemples. Relation entre
E N D
INF L14Initiation aux statistiques7 – Liaison entre variables quantitatives
Introduction • Jusqu’ici, examen d’une variable à la fois • Statistiques univariées • Mais on peut aussi regarder la relation entre deux variables • Statistiques bivariées
Exemples • Relation entre • le poids et la taille des individus • le revenu de la famille et les résultats scolaire des enfants • le tabagisme et le taux de mortalité par cancer • la pluviométrie et le nombre d’incendies • la croissance économique et le taux de chômage • etc.
Différents types de variables • Deux variables quantitatives • ex. : poids ~ taille • Deux variables qualitatives • ex. : sexe ~ situation de famille • Une variable qualitative et une quantitative • ex. : sexe ~ taux de mortalité par accident
Variables quantitatives • Exemple linguistique • longueur des textes • français ~anglais • Textes parallèles
ActualitésL'UNESCO et Microsoft signent un accord de coopération pour réduire la fracture numérique • 17-11-2004 (Communiqué de presse UNESCO) • Microsoft a rejoint aujourd’hui la coalition de grands partenaires* du secteur privé qui soutient la stratégie mondiale de l’UNESCO visant à utiliser les technologies de l’information et de la communication (TIC) pour améliorer l’éducation et le développement social et économique dans le monde. • Le Directeur général de l’UNESCO, Koïchiro Matsuura, et Bill Gates, Président et Architecte logiciel de Microsoft, ont signé un accord de coopération au siège de l’Organisation en présence de Hans-Heinrich Wrede, Président du Conseil exécutif, et de l’Ambassadeur Louise Oliver, Délégué permanent des Etats-Unis d’Amérique auprès de l’UNESCO. L’accord définit huit domaines dans lesquels l’UNESCO et Microsoft vont travailler ensemble, en échangeant expériences, savoir-faire et projets de développement : • Education et apprentissage; • Accès communautaire et développement; • Diversité et préservation culturelles et linguistiques; • Inclusion numérique et transfert de compétences; • Echange et promotion des meilleures pratiques en matière d’utilisation des TIC pour le développement socio-économique; • Renforcement des communautés de pratique en ligne, y compris par le développement de contenus, le partage des connaissances et l’autonomisation par la participation; • Faciliter l’échange d’information et d’applications logicielles; • Partage d’expertise et de stratégies. • Les projets dans ces domaines entraîneront la coopération de partenaires très variés : secteur privé, secteur public et organisations intergouvernementales, ainsi qu’acteurs de la société civile. • NewsUNESCO and Microsoft Sign Cooperation Agreement to Help Bridge the Digital Divide • 17-11-2004 (UNESCO Press Release) • Microsoft today joined the coalition of major private sector partners supporting UNESCO’s global strategy to draw on information and communication technologies (ICT) to improve education, social and economic development worldwide. • The Director-General of UNESCO, Koïchiro Matsuura, and Bill Gates, Microsoft’s Chairman and Chief Software Architect, signed a cooperation agreement at Organization Headquarters in the presence of Hans-Heinrich Wrede, Chairman of the Executive Board, and Ambassador Louise Oliver, Permanent Delegate of the United States of America to UNESCO. The agreement defines eight areas in which UNESCO and Microsoft will work together, exchanging experiences, know-how and developing projects: • education and learning; • community access and development; • cultural and linguistic diversity and preservation; • digital inclusion and capacity; • exchange and promotion of best practices on the use of ICT for socio-economic development; • fostering web-based communities of practice, including content development, knowledge sharing and empowerment through participation; • facilitating exchange of information and of software applications; • sharing expertise and strategies. • Projects in these areas will draw on cooperation with a variety of partners: from the private sector, government, and intergovernmental organizations, as well as civil society actors. http://portal.unesco.org
Alignement (paragraphes) Nombre de caractères
Représentation graphique • Synonymes • Graphique XY • Diagramme de dispersion • Nuage de points • Pour chaque individu, on porte • la première variable en abscisse • la deuxième en ordonnée • Autant de points que d’individus
Exemple texte parallèle • Variable 1 = nb caractères en français • Variable 2 = nb caractères en anglais • Individus = paragraphes
Nuage de points L’alignement des points indique une liaison entre les variables ou corrélation
Absence de corrélation • Exemple • 1000 premiers mots du Petit Prince • Pas de corrélation entre la position du mot et sa longueur
Force de la corrélation • Comparer
corrélation parfaite corrélation forte corrélation faible absence de corrélation
Direction de la corrélation Positive Négative
Corrélation ≠ causalité • Corrélation entre le nombre de cigognes et le nombre de naissances • Mais pas de lien de causalité !
Droite de régression • Droite de régression ou droite des moindres carrés
Parfois on sait que la droite passe par l’origine Exemple : textes parallèles 0 car en français = 0 car en anglais ! On peut imposer que la droite passe par l’origine
Prédiction • Que nous dit cette droite ? • En moyenne les paragraphes anglais sont plus courts que les textes français dans un rapport de 0,85 • Donc, si j’ai 200 caractères en français, je m’attends à avoir • 200 * 0,85 = 170 caractère en anglais • Du moins dans ce type de texte !
Coefficient de corrélation • Coefficient de corrélation(de Pearson) • varie entre -1 et +1 • -1 = corrélation parfaite (négative) • 0 = absence de corrélation • +1 = corrélation parfaite( positive) • Notation : r
Coefficient de détermination • Coefficient de détermination • carré du coefficient de corrélation • notation r2 • proportion de la variation de la variable Y qui s'«explique» par les variations de la variable X
Tableur S’obtient aussi directement sur le graphique (option)
Corrélation non linéaire • Exemple • relation quadratique • y = ax2 + bx + c
En linguistique : très souvent relation puissance y = x-a (a proche de 1) Exemple: relation rang ~fréquence (loi de Zipf)
Représentation logarithmique • Devient une droite
Termes à retenir • Statistiques univariées, bivariées • Corrélation • Droite de régression • Pente, ordonnée à l’origine • Coefficient de corrélation (de Pearson) • Coefficient de détermination