1 / 60

Plan la séance 11 L’analyse multivariée

Plan la séance 11 L’analyse multivariée. Les tableaux croisés L’hypothèse Le test du khi carré Démonstration du logiciel SPSS (tableaux croisés) Autres types d’analyses multivariées Comparaison de moyennes Analyses de variance Analyses de corrélation Analyses de régression Atelier :

Download Presentation

Plan la séance 11 L’analyse multivariée

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Plan la séance 11 L’analyse multivariée • Les tableaux croisés • L’hypothèse • Le test du khi carré • Démonstration du logiciel SPSS (tableaux croisés) • Autres types d’analyses multivariées • Comparaison de moyennes • Analyses de variance • Analyses de corrélation • Analyses de régression • Atelier : • Réaliser des analyses croisées avec vos données • Rencontre de chacune des équipes avec le professeur

  2. Les tableaux croisés • Analyse des données en fonction de deux variables (parfois plus) • Variable indépendante VS variable dépendante • Analyse du pourcentage des réponses selon la variable indépendante • Comparaison des différences entre deux catégories de la variable indépendante

  3. Les différences ne sont ni fortes, ni significatives (47,7%, p = 0,523) Tableau croisé de la variable « Consommation » selon le sexe Existe-t-il des différences entre les hommes et les femmes dans le niveau de consommation?

  4. L’hypothèse • Proposition, souvent intuitive, qui permet d’expliquer un phénomène, (p. ex. : Les hommes consomment plus que les femmes) • Afin de rejeter ou non une hypothèse, on doit démontrer l’existence de différences significatives entre deux catégories d’une variable (p. ex. féminin ou masculin pour le sexe) par rapport à une autre variable (p. e. le niveau de consommation). • Formulation • H0 : %F = %M (hypothèse nulle : il n’existe pas de différence entre les femmes et les hommes [quant au niveau de consommation]) • H1 : %F ≠ %M (hypothèse alternative il existe une différence entre les femmes et les hommes [quant au niveau de consommation]) • Dans cet exemple (diapo précédente), on ne rejette PAS l’hypothèse nulle

  5. Test d’hypothèse : le test du khi carré (ou Khi deux – X2) • Un test statistique parmi les plus utiles • Utilisable avec tout type de données : • PCQ tous les types de données peuvent être transformées en données nominales • Détection de différence significatives entre les fréquences observées dans l’étude et les fréquences théoriques attendues • Seuil de signification : • probabilité permettant de rejeter ou non l’hypothèse nulle H0 • usuel ≥ 95% (p≤ 0,05) Tiré et adapté de: McGown, K.L., Marketing Research: Text and Cases, Winthrop Publishers, 1979, p. 236

  6. Tableau croisé de la variable « Restaurant » selon l’estime de soi • H0 : %SEI- = %SEI moyen = %SEI+ • Il n’existe pas de différences entre le pourcentage des personnes dont l’estime est faible et celui des personnes dont l’estime est forte (quant à la mention du restaurant) • L'estime de soi n'influence pas la mention du restaurant comme produit représentatif de l'image de soi • H1 : %SEI- ≠ %SEI moyen ≠ %SEI+ • Il existe des différences entre le pourcentage des personnes dont l’estime est faible et celui des personnes dont l’estime est forte (quant à la mention du restaurant) • L'estime de soi influence la mention du restaurant comme produit représentatif de l'image de soi

  7. H0 : %SEI - = %SEI moyen = %SEI + H1 : %SEI - ≠ %SEI moyen ≠ %SEI + Tableau croisé de la variable « Restaurant » selon l’estime de soi

  8. Tableau croisé de la variable « Restaurant » selon l’estime de soi

  9. Tableau croisé de la variable « Restaurant » selon l’estime de soi • On peut rejeter H0 (il existe des différences entre %SEI- et %SEI+) • Avec un seuil de signification supérieur à 95 % (p = 0,037) on peut affirmer qu’un pourcentage plus élevé de personnes dont l’estime de soi est faible mentionne le restaurant comme un produit représentatif de l’image de soi • L'estime de soi influence la mention du restaurant comme produit représentatif de l'image de soi

  10. Tableau croisé de l’usage d’internet selon le sexe Données du tableau 13.1 • H0 : %F = %M • Il n’existe pas de différences entre le pourcentage des femmes et celui des hommes (quant l’usage d’Internet) • Le sexe n'influence pas l’usage d’internet • H1 : %F ≠ %M • Il existe des différences entre le pourcentage des femmes et celui des hommes (quant l’usage d’Internet) • Le sexe influence l’usage d’internet

  11. H0 : %F = %H H1 : %F≠ %H Tableau croisé de l’usage d’internet selon le sexeDonnées du tableau 13.1

  12. Tableau croisé de l’usage d’internet selon le sexe Données du tableau 13.1

  13. Tableau croisé de l’usage d’internet selon le sexe Données du tableau 13.1 • On peut rejeter H0 (il existe des différences entre %F = %M) • Avec un seuil de signification égal à 99 % (p = 0,010) on peut affirmer que seulement des hommes utilisent l’Internet 11 heures ou plus par semaine • Inversement, on peut également affirmer qu’un pourcentage deux fois plus élevé de femmes que d’hommes utilisent l’Internet 5 heures ou moins par semaine • Le sexe influence la durée de l’usage d’Internet

  14. L’analyse de corrélation linéaire • Relation entre deux variables métriques (intervalle ou de proportion) • L’augmentation de la variable 1 correspond-t-il à une augmentation ou à une diminution de la variable 2? • Relation linéaire • Coefficient de corrélation de Pearson (r) • +1 = relation positive parfaite • -1 = relation négative parfaite Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS,  5e éd.,  Paris: Pearson Education France.

  15. Balises établies par Cohen (1988) pour estimer l’effet de corrélation Source : http://pages.usherbrooke.ca/spss/pages/statistiques-inferentielles/correlation.php?searchresult=1&sstring=corr%C3%A9lation

  16. Ho : r = 0 (aucune corrélation entre âge et SEI personnel) H1 : r ≠ 0 (corrélation entre âge et SEI personnel) Analyse de corrélation linéaire entre l’âge et l’estime de soi personnelle

  17. Analyse de corrélation linéaire entre l’âge et l’estime de soi personnelle • On peut rejeter H0 (il existe une corrélation entre l’âge et l’estime de soi personnelle) • Avec un seuil de signification supérieur à 95 % (p = 0,027) on peut affirmer que l’âge influence l’estime de soi personnelle • La valeur positive de r (= +0,169) indique une relation positive entre les variables • En outre, la valeur plus proche de « 0 » que de « +1 » de r indique une corrélation positive imparfaite (plutôt faible) • L’estime de soi personnelle augmente un peu avec l’âge

  18. Ho : r = 0 (aucune corrélation entre attitude et durée) H1 : r ≠ 0 (corrélation entre attitude et durée) Analyse de corrélation linéaire entre l’attitude envers la ville et la durée de résidenceDonnées du tableau 15.1

  19. Analyse de corrélation linéaire entre l’attitude envers la ville et la durée de résidence Données du tableau 15.1 • On peut rejeter H0 (il existe une corrélation entre l’attitude envers la ville et la durée de résidence) • Avec un seuil de signification supérieur à 99 % (p = 0,000) on peut affirmer que la durée de résidence influence l’attitude envers la ville • La valeur positive de r est (= +0,936) indique une relation positive entre les variables • En outre, la valeur très proche de « +1 » de r indique une corrélation positive presque parfaite (très forte) • L’attitude envers la ville devient plus favorable avec une augmentation de la durée de résidence

  20. Démonstration du logiciel SPSS • Réalisation de plusieurs analyses croisées avec des données fictives : • tableau_13_1.sav : http://eut4115.uqam.ca/spss/tableau_13_1.sav • restaurants_categories.sav : http://eut4115.uqam.ca/spss/restaurants_categories.sav Source : http://en.wikipedia.org/wiki/SPSS

  21. Les comparaisons de moyennes • Analyser la relation entre une variable non métrique (nominale ou ordinale) et une variable métrique (intervalle ou de proportion) • Comparaison de deux moyennes indépendantes • Comparaison de deux moyennes appareillées • Comparaison de plusieurs moyennes Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS,  5e éd.,  Paris: Pearson Education France.

  22. Moyennes indépendantesTest en t (T-Test) • Hypothèse : • H0 : μ1 = μ2 (les moyennes sont identiques) • H1 : μ1 ≠ μ2 (les moyennes sont différentes) • Si les moyennes sont différentes, il existe une relation entre la variable indépendante et la variable dépendante • Rejeter H0 si t> 1,98 out < -1,98 • p ≤ 0,05, seuil de signification ≥ 95 % Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS,  5e éd.,  Paris: Pearson Education France.

  23. H0 : μ1 = μ2 (Moyenne SEI NON = Moyenne SEI OUI) H1 : μ1 ≠ μ2 (Moyenne SEI NON ≠ Moyenne SEI OUI) Bilatéral Moyennes indépendantes Analyse de la variable « Spectacle culturel » selon l’estime de soi

  24. Moyennes indépendantes Analyse de la variable « Spectacle culturel » selon l’estime de soi • Les personnes qui mentionnent le spectacle culturel comme un produit représentatif de leur image sont plus nombreuses que celles qui ne mentionnent pas ce produit (136 VS 39) • L’écart des moyennes (6,10 VS 5,15) est significatif (t = 2,694) • On peut rejeter H0 (les moyennes sont différentes) • Avec un seuil de signification supérieur à 99 % (p = 0,008) on peut affirmer que la moyenne de l’estime de soi des personnes qui mentionnent le spectacle culturel comme un produit représentatif de leur image est plus faible • L’estime de soi personnelle influence la mention du spectacle culturel comme produit représentatif de l’image de soi

  25. H0 : μ1 = μ2 (Moyenne F = Moyenne M) H1 : μ1 ≠ μ2 (Moyenne F ≠ Moyenne M) Bilatéral Moyennes indépendantes Analyse de l’usage d’Internet selon le sexeDonnées du Tableau 13.1

  26. Moyennes indépendantes Analyse de l’usage d’Internet selon le sexeDonnées du Tableau 13.1 • L’écart des moyennes (9,36 VS 3,87) est significatif (t = 4,354) • On peut rejeter H0 (les moyennes sont différentes) • Avec un seuil de signification supérieur à 99 % (p = 0,000) on peut affirmer que le nombre d’heures d’usage d’Internet est plus élevé pour les hommes (9,36) que pour les femmes (3,87) • Le sexe influence l’usage de l’Internet

  27. Moyennes appareilléesTest en t (T-Test) • Hypothèse : • H0 : μ1 = μ2 (les moyennes sont identiques) • H1 : μ1 ≠ μ2 (les moyennes sont différentes) • Si les moyennes sont identiques, il existe une relation entre les deux variables • Rejeter H0 si t> 1,98 out < -1,98 • p ≤ 0,05, seuil de signification ≥ 95 % Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS,  5e éd.,  Paris: Pearson Education France.

  28. H0 : μ1 = μ2 (Moyenne SEI social = Moyenne SEI personnel) H1 : μ1 ≠ μ2 (Moyenne SEI social ≠ Moyenne SEI personnel) Moyennes appareillées Analyse de l’estime de soi sociale et de l’estime de soi personnelle

  29. Moyennes appareillées Analyse de l’estime de soi sociale et de l’estime de soi personnelle • L’écart des moyennes (6,75 VS 5,37) est significatif (t = 9,317) • On peut rejeter H0 (les moyennes sont différentes) • Avec un seuil de signification supérieur à 99 % (p = 0,000) on peut affirmer que les moyennes de l’estime de soi sociale et de l’estime de soi personnelle sont différentes • Il n’existe pas de relation entre ces deux aspects de l’estime de soi

  30. H0 : μ1 = μ2 (Moyenne Internet = Moyenne Technologie) H1 : μ1 ≠ μ2 (Moyenne Internet≠ Moyenne Technologie) Moyennes appareillées Analyse de l’attitude envers Internet et de l’attitude envers la technologie Données du Tableau 13.1

  31. Moyennes appareillées Analyse de l’attitude envers Internet et de l’attitude envers la technologie Données du Tableau 13.1 • L’écart des moyennes (5,17 VS 4,10) est significatif (t = 7,059) • On peut rejeter H0 (les moyennes sont différentes) • Avec un seuil de signification supérieur à 99 % (p = 0,000) on peut affirmer que les moyennes de l’attitude envers Internet et de l’attitude envers la technologie sont différentes • Il n’existe pas de relation entre les deux attitudes

  32. Plusieurs moyennesAnalyse de variance • Hypothèse : • H0 : μ1 = μ2 = μ3 (les moyennes sont identiques) • H1 : μ1 ≠ μ2 ≠ μ3 (les moyennes sont différentes) • Si les moyennes sont différentes, il existe une relation entre la variable indépendante et la variable dépendante • Rejeter H0 si l’un ou l’autre des critères suivants est satisfait : • Fcalculé ≥ Ftable • p ≤ 0,05 (seuil de signification ≥ 95 %) Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS,  5e éd.,  Paris: Pearson Education France.

  33. Ho : μ1 = μ2 = μ3 (Moyenne Plus = Moyenne Comparable = Moyenne Moins) H1 : μ1 ≠ μ2 ≠ μ3(Moyenne Plus ≠ Moyenne Comparable ≠ Moyenne Moins) Plusieurs moyennes Analyse de variance du niveau de consommation selon le revenu Ftable = 3,07 si p = 0,05

  34. Plusieurs moyennes Analyse de variance du niveau de consommation selon le revenu

  35. Plusieurs moyennes Analyse de variance du niveau de consommation selon le revenu • On peut rejeter H0 (les moyennes sont différentes) • Fcalculé = 4,301 ≥ Ftable = 3,07 • p = 0,015 ≤ 0,05 • L’écart des moyennes (9,14 VS 6,80 VS 6,13) est significatif • Avec un seuil de signification supérieur à 95 % (p = 0,015), on peut affirmer que les personnes dont la moyenne du revenu est plus élevée affirment consommer davantage • Une augmentation du revenu augmente le niveau de consommation (ce qui n’est pas surprenant à vrai dire)

  36. Ho : μ1 = μ2 = μ3 (Moyenne 5- = Moyenne 6-10 = Moyenne 11+) H1 : μ1 ≠ μ2 ≠ μ3(Moyenne 5- ≠ Moyenne 6-10 ≠ Moyenne 11+) Plusieurs moyennes Analyse de variance de l’usage d’internet selon l’attitude envers Internet Données du Tableau 13.1 Ftable = 3,35 si p = 0,05

  37. Plusieurs moyennes Analyse de variance de l’usage d’internet selon l’attitude envers Internet - Données du Tableau 13.1

  38. Plusieurs moyennes Analyse de variance de l’usage d’internet selon l’attitude envers Internet Données du Tableau 13.1 • On peut rejeter H0 (les moyennes sont différentes) : • Fcalculé = 3,700 ≥ Ftable = 3,35 • p = 0,038 ≤ 0,05 • L’écart des moyennes (4,73 VS 5,13 VS 6,14) est significatif • Avec un seuil de signification supérieur à 95 % (p = 0,038), on peut affirmer que les personnes qui font un usage d’Internet de 11 heures ou plus par semaine ont une attitude en moyenne plus positive que celles qui l’utilisent pendant 6 à 10 heures ou 5 heures et moins • Une attitude positive envers Internet augmente l’usage d’Internet (ce qui n’est pas surprenant à vrai dire)

  39. L’analyse de régression linéaire simple • Relation de dépendance entre deux variables métriques (intervalle ou de proportion) : • Modèle de prédiction • Yi = β0 + β1Xi + ei • Yi = variable dépendante • β0 = constante (origine) • β1 = coefficient de régression • Xi = variable indépendante ou explicative • ei = erreur (ou résidus) • Variation totale expliquée : • r2 = coefficient de détermination • r2 varie entre 0 et 1 • Rejeter H0 si F ≥ 3,07 Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS,  5e éd.,  Paris: Pearson Education France.

  40. Ho : β1 = 0 (aucune relation entre SEIet âge) H1 : β1 ≠ 0 (SEI varie avec âge) β0 β1 Analyse de régression linéaire entre l’estime de soi personnelle et l’âge

  41. Analyse de régression linéaire entre l’estime de soi personnelle et l’âge

  42. β0 Analyse de régression linéaire entre l’estime de soi personnelle et l’âge

  43. Analyse de régression linéaire entre l’estime de soi personnelle et l’âge • On peut rejeter H0 (F = 5,002) • L’âge exerce une influence sur l’estime de soi personnelle • SEIi = 4,142 + 0,038(âgei) + ei • Avec un seuil de signification supérieur à 95 % (p = 0,027) on peut affirmerque pour chaque augmentation d’un an de l’âge, l’estime de soi personnelle augmente de 0,038 • Le modèle explique 2,8 % de la variation (r2 = 0,028)

  44. Ho : β1 = 0 (aucune relation entre l’attitude et la durée) H1 : β1 ≠ 0 (attitude varie avec durée) β0 β1 Analyse de régression linéaire entre l’attitude envers la ville et la durée de résidence

  45. Analyse de régression linéaire entre l’attitude envers la ville et la durée de résidence

  46. β0 Analyse de régression linéaire entre l’attitude envers la ville et la durée de résidence

  47. Analyse de régression linéaire entre l’attitude envers la ville et la durée de résidence • On peut rejeter H0 (F = 70,803) avec un seuil de signification supérieur à 99 % (p = 0,000) • La durée de résidence exerce une influence sur l’attitude positive envers la ville • Attitudei = 1,079 + 0,590(duréei) + ei • On peut affirmerque pour chaque augmentation d’un an de la durée de résidence, l’attitude positive envers la ville augmente de 0,590 • Le modèle explique 87,6 % de la variation (r2 = 0,876)

  48. L’analyse de régression multiple • Relation de dépendance entre trois, ou plus, variables métriques : • Modèle de prédiction • Yi = β0 + (β1X1)i+ (β2X2)i + (β3X3)i+… + ei • Yi = variable dépendante • β0 = constante (origine) • Β1-n = coefficients de régression • X1-n = variables indépendantes ou explicatives • ei = erreur (ou résidus) • Variation totale expliquée : • r2 = coefficient de détermination • r2 varie entre 0 et 1 • Test t (T-Test) indique l’influence relative de chaque variable • Rejeter H0 si F ≥ 3,07 Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS,  5e éd.,  Paris: Pearson Education France.

  49. Ho : β1-n=0 (aucun effet durée pub., expérience et diplôme sur ventes) H1 : β1-n ≠ 0 (ventes varient en fonction pub., expérience et diplôme) β0 β1 β2 β3 Régression multiple entre les ventes, la publicité, l’expérience du cuisinier et le diplôme ITHQ (Données restaurants.sav)

  50. Régression multiple entre les ventes, la publicité, l’expérience du cuisinier et le diplôme ITHQ (Données restaurants.sav)

More Related