140 likes | 246 Views
Université de Ouagadougou. Séminaire national sur l’analyse des données du recensement au Burkina Faso Ouagadougou, 14-16 novembre 2011. Fondements de l’analyse bivariée et la notion de mesure d’association Notion de mesures d’association. Plan de présentation.
E N D
Université de Ouagadougou Séminaire national sur l’analyse des données du recensement au Burkina Faso Ouagadougou, 14-16 novembre 2011 Fondements de l’analyse bivariée et la notion de mesure d’associationNotion de mesures d’association
Plan de présentation • Caractéristiques d’une relation entre deux variables • Notion de mesure d’association
Caractéristiques d’une relation entre deux variables • Relation asymétrique et relation symétriqueVariable indépendante et variable dépendante Une relation entre deux variables est dite asymétrique lorsque l’une des deux variables peut être considérée comme la « cause » et l’autre comme l’« effet ». On parle alors de relation de « cause à effet ». L’ordre temporel de la relation, c’est-à-dire sa direction, est supposé connue: X -----------> Y où X est la « variable indépendante » ou « variable explicative » et Y la « variable dépendante » ou « variable expliquée » ou encore variable « effet »
Caractéristiques d’une relation entre deux variables • Relation symétrique Une relation entre deux variables est dite symétrique lorsque les deux variables agissent l’une sur l’autre simultanément : X <-----------> Y Il ne faut pas confondre la relation symétrique avec la relation réciproque dans laquelle les deux variables agissent l’une sur l’autre, mais à des temps différents. Une relation entre X1 et X2 peut s’exprimer ainsi: X1 -----------> X2 ----------->X1
Caractéristiques d’une relation entre deux variables • Relation forte, relation faible et relation nulle • Relationforte Une relation est dite forte quand le comportement de l’une est très lié au comportement de l’autre, ou encore que les variations de l’une sont accompagnées dans des proportions comparables des variations de l’autre. • Relationfaible Une relation est dite faible quand le comportement ou les variations de l’une des variables a un effet presque négligeable sur le comportement ou les variations de l’autre
Caractéristiques d’une relation entre deux variables • Relationnulle La relation entre deux variables est dite nulle quand il n’existe pas de relation entre les deux variables. Les variations de l’une n’ont aucun effet sur le comportement de l’autre. Même si on connaît l’une des variables, on ne peut rien déduire de l’autre.
Caractéristiques d’une relation entre deux variables • Relation positive et relation négative • Relationpositive La relation entre deux variables est dite positive quand les deux variables varient dans le même sens, c’est-à-dire augmentent ou diminuent en même temps. • Relationnégative La relation entre deux variables est dite négative quand les deux variables varient en sens contraire, c’est-à-dire: quand l’une augmente, l’autre diminue ou quand l’une diminue, l’autre augmente.
Caractéristiques d’une relation entre deux variables En combinant l’orientation (positive ou négative) d’une relation avec son degré (fort ou faible), nous obtenons les quatre possibilités suivantes: • Relation positive forte; • Relation positive faible; • Relation négative forte; • Relation négative faible. NB: Cas particulier de la variable nominale Une relation entre deux variables dont une est nominale ne peut être positive ou négative. Les catégories de la variable nominale ne sont pas orientées. On décrit alors la relation en indiquant la catégorie de la variable nominale qui est liée à la catégorie de l’autre variable.
Caractéristiques d’une relation entre deux variables • Relation linéaire et relation non linéaire • Relationlinéaire La relation linéaire est représentée graphiquement par une droite. Dans une relation linéaire les deux variables changent dans des rapports équivalents • Relationnon linéaire Les relations non linéaires peuvent prendre des formes diverses, entre autres parabolique ou exponentielle. En étudiant un graphique, on peut décomposer une relation non linéaire en plusieurs relations linéaires pour des strates de la population étudiée.
Notion de Mesure d’Associations (MA) • Caractéristiques d’une Mesure d’Association (MA) Une MA est un paramètre statistique qui indique le degré où, le cas échéant, l’orientation et la forme de la relation existant entre deux ou plus de deux variables Les caractéristiques suivantes permettent d’évaluer les mesures d’association et aident surtout à faire une bonne interprétation: • Standardisation de la mesure Quand il n’ y a pas de relation entre les variables, la mesure d’association prend la valeur 0. Il est important de souligner que l’inverse n’est pas nécessairement vrai.
Notion de Mesure d’Associations (MA) Standardisation de la mesure (suite) La MA varie entre 0 et 1 (0<MA<=1) quand la relation est positive. La MA varie entre -1 et 0 (-1<=MA<0) quand la relation est négative. • Stabilité de la mesure par rapport aux marges Une bonne mesure d’association ne varie pas ou varie peu quand on modifie la disposition des données, le nombre de catégories ou les valeurs marginales .
Notion de Mesure d’Associations (MA) • Mesure symétrique et asymétrique Une mesure d’association est asymétrique quand elle change suivant que l’une ou l’autre des deux variables de la relation est traitée comme indépendante ou dépendante. Une mesure d’association symétrique ne change pas, quelle que soit la variable traitée comme dépendante ou indépendante dans une relation. • Interprétation de la mesure L’interprétation claire et précise d’une MA est une caractéristique fondamentale. Certaines mesures d’associations peuvent être interprétées en terme de proportions de variations.
Notion de Mesure d’Associations (MA) • Sensibilité de la mesure à la forme de la relation Une mesure d’association doit idéalement être sensible à la linéarité ou à la non-linéarité d’une relation entre deux variables. Il est important de tenir compte de cette propriété dans l’interprétation d’ une mesure, surtout en ce qui concerne les variables quantitatives. • Distribution d’échantillonnage de la mesure La notion de distribution d’échantillonnage est fondamentale en interférence statistique. Elle est déterminée par l’ensemble des valeurs que prend une mesure pour tous les échantillons possibles, de même taille que l’on peut tirer d’une population.
Notion de Mesure d’Associations (MA) • Mesures d’Association (MA) et la relation parfaite Les MA ne prennent pas toutes la valeur de l’unité dans les mêmes conditions. On doit donc interpréter une relation parfaite ou très forte exprimée par une mesure en tenant compte de la logique de calcul de cette mesure. • Mesures d’Association (MA) de type PRE L’abréviation PRE« Proportional Reduction in Error » est une caractéristique de certaines mesures d’association qui indiquent la proportion par laquelle on réduit l’erreur qu’on commettrait en estimant le comportement d’une variable sans tenir compte d’une autre variable.