360 likes | 1.17k Views
Qu'est-ce qu'une analyse discriminante?. Permet d'
E N D
1. Analyse Discriminante Fatim Cissé
Brigitte Lalonde
Frédéric Moisan
Katleen Tessier
2. Qu’est-ce qu’une analyse discriminante? Permet d’étudier la différence entre 2 ou plusieurs groupes en tenant compte de multiples variables simultanément
Groupes mutuellement exclusifs
Nécessite 2 groupes ou plus, qui diffèrent sur plusieurs variables: celles-ci peuvent être mesurées à 2 niveaux de mesure (intervalle et ratio)
Intro: anal. Discrim. Est une procédure stats avancée et complexe, nous allons tenter d’être le plus simple possible
Voir schéma p.10
Interval: pas de 0 absolu
Ratio: avec 0 absolu
Intro: anal. Discrim. Est une procédure stats avancée et complexe, nous allons tenter d’être le plus simple possible
Voir schéma p.10
Interval: pas de 0 absolu
Ratio: avec 0 absolu
3. Qu’est-ce qu’une analyse discriminante? (suite)
Le but d’une analyse discriminante est d’étudier les relations entre une variable qualitative et un ensemble de variables explicatives quantitatives
Aide à analyser les différences entre les groupes et/ou donne les moyens pour assigner (classifier) les cas dans le groupe lui ressemblant le plus
Cas: voir plus tard dans notre ex.Cas: voir plus tard dans notre ex.
4. Objectifs de l’analyse discriminante Déterminer les variables explicatives les plus discriminantes vis à vis des classes déterminées
Déterminer à quel groupe appartient un individu à partir de ses caractéristiques
Mais surtout à valider une classification ou à faire un choix entre plusieurs classifications pour savoir laquelle est la plus pertinente. (L’analyse discriminante intervient donc à postériori d’une classification).
5. Quand utiliser l’analyse discriminante? Présence de 2 ou plusieurs groupes mutuellement exclusifs
Chacun des cas (unité d’analyse; ce qui est étudié) doivent appartenir à 1 seul groupe
Exception: cas n’appartient à aucun groupe car - exclu
- va être classifié plus tard dans le processus Data cases (ex. Animaux, pays.etc.)
Exception: exclu pour une raison x par le chercheur
clasiffié plus tard basé, car incidents fururs Data cases (ex. Animaux, pays.etc.)
Exception: exclu pour une raison x par le chercheur
clasiffié plus tard basé, car incidents fururs
6. Quand utiliser l’analyse discriminante? (suite) Analyse discriminante: un terme large, englobant plusieurs activités statistiques très reliées
Le chercheur ne les utilise pas toutes à la fois, il en sélectionne quelques unes
Plus fréquemment: celles pour interpréter les différences entre les groupes et celles pour classer les cas dans des groupes
Ex: Wilks’ Lambda, Canonical Discriminant Function Coefficient, Eigenvalue, etc. Wilks est le + utiliséWilks est le + utilisé
7. Quand utiliser l’analyse discriminante? (suite) Le chercheur est appelé à interpréter la façon dont les groupes diffèrent
il discrimine!
Selon certaines caractéristiques
Formules mathématiques dérivant des fonctions discriminantes (générées par SPSS)
Aussi utilisé pour classifier
Discriminer selon certaines caractéristiques, les discriminants les plus puissants
Come mentionné précédemment: pas juste pour interp., mais pour classifier comme dit plus tôtDiscriminer selon certaines caractéristiques, les discriminants les plus puissants
Come mentionné précédemment: pas juste pour interp., mais pour classifier comme dit plus tôt
8. Quand utiliser l’analyse discriminante? (suite) Variables discriminantes: caractéristiques pour distinguer les groupes (intervalle et ratio)
Aucunes limites pour le nombre de variables discriminantes, en autant que le nombre total de cas dépasse le nombre de variables par 2 ou plus
9. Quand utiliser l’analyse discriminante? (suite) Quelques limites:
1- Les variables explicatives doivent être métriques ou binaires
2- Aucune variable ne peut être une combinaison linéaire d’autres variables discriminantes
3- La matrice de covariance de la population est égale pour chaque groupe
4- Chaque groupe est tiré d’une population ayant une distribution multivariée normale
Si les données ne les respectent pas, les résulats statistiques ne réflèteront pas bien la réalité Limites au niveau des propriétés statistiques que les var.discri. Peuvent avoir
1-rapel; combinaison linéaire est la somme d’une ou plusieurs var. ayant été ‘weighted’ en terme constant
(raisons math, mais aussi logique, car une combinaison n’apporte ien de nouveau, c’est redondant)
3- sinon, l’interprétation de la significance devra être faite avec qqs bémolsLimites au niveau des propriétés statistiques que les var.discri. Peuvent avoir
1-rapel; combinaison linéaire est la somme d’une ou plusieurs var. ayant été ‘weighted’ en terme constant
(raisons math, mais aussi logique, car une combinaison n’apporte ien de nouveau, c’est redondant)
3- sinon, l’interprétation de la significance devra être faite avec qqs bémols
10. En résumé…c’est quoi?
Analyse discriminante est utilisée pour étudier la différence entre 2 ou + groupes et un ensemble de variables discriminantes
Cette technique relie 1 variable nominale à plusieurs variables d’intervalles
Petit rapel….montrer encore la figure 1 (p.10)Petit rapel….montrer encore la figure 1 (p.10)
11. Attention! Aucune mention de direction de l’effet
Les groupes n’ont pas été identifiés comme étant des VD ou des VI, ni les variables discriminantes
Sinon, c’est une régression multiple
Donc, la principale différence est que l’analyse discriminante traite la VD comme étant mesurée au niveau nominal (groupes) Voir schéma 1: pas de flèche
Sinon c’est une rég. Mul.: si les gr sont identifiés comme dépendants des var,discriminantesVoir schéma 1: pas de flèche
Sinon c’est une rég. Mul.: si les gr sont identifiés comme dépendants des var,discriminantes
12. En résumé…conditions 2 ou plusieurs groupes
Minimum de 2 cas par groupe
N’importe quel nombre de variables discriminantes, mais moins que le total du nombre de cas - 2
Variables disriminantes: niveau de mesure d’intervalle
Aucune variable discriminante n’est la combinaison linéaire de d’autres variables discriminantes
Chaque groupe est tiré d’une population avec une distribution multivariée normale des variables discriminantes Rapel des supp à retenirRapel des supp à retenir
13. Exemple de cas: Les Terroristes
14. Démarche à suivre dans SPSS Aller dans Analyse > Classify > discriminant
Dans « Grouping Variable » (i.e. les critère de regroupement), il faut indiquer la variable à expliquer en la sélectionnant dans la partie de droite puis en cliquant sur la flèche qui pointe vers la droite. SPSS demande alors de définir l’intervalle, c’est-à-dire les différentes modalités que la variable peut prendre.
Dans « Independents » (i.e. les variables explicatives), il faut indiquer les variables métriques que l’on souhaite intégrer à l’analyse. Il est important de choisir « Use stepwise method » (i.e. la méthode pas à pas).
15. Démarche à suivre dans SPSS (suite) Trois options s’offrent alors à nous :
« statistics »: Dans la boîte qui apparaît, il convient de cocher « Means » (moyennes), « Univariate ANOVAs » (ANOVA à 1 facteur) et « Box’s M » (Test de Box) dans « Descriptives » et « Fischer’s » ainsi que « Unstandardized » dans « Function Coefficients ».
« Classify »: Dans la boîte qui apparaît, il convient de cocher « Summary Table » (option qui permet l’affichage de la matrice de confusion) et « Leave-one-out classification » dans « Display ».
(On ne touchera pas aux différentes options de « Méthode… »)
16. Analyse des résultats Une analyse discriminante se déroule en 3 étapes:
1. On vérifie l’existence de différences entre les groupes.
2. On valide l’étude.
3. On vérifie le pouvoir discriminant des axes.
4. On juge la qualité de la représentation du modèle.
La 3ème étape peut être passée dans la plupart des cas.