1 / 44

Méthodes et outils pour la démarche expérimentale Séance 9

Méthodes et outils pour la démarche expérimentale Séance 9. Nadine Mandran Formation doctorants Janvier-Mars 2011. Hier et aujourd’hui. Types de variables Le rôle des variables Le plan expérimental L’individu statistique La notion d’échantillon Stat descriptives Loi de distribution

tuyen
Download Presentation

Méthodes et outils pour la démarche expérimentale Séance 9

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Méthodes et outils pour la démarche expérimentaleSéance 9 Nadine Mandran Formation doctorants Janvier-Mars 2011

  2. Hier et aujourd’hui Types de variables Le rôle des variables Le plan expérimental L’individu statistique La notion d’échantillon Stat descriptives Loi de distribution Manipuler des données La démarche statistique inférentielle Choisir une méthode statistiques Anova ou tests non paramétriques Tests du chi 2 de corrélation, de régression

  3. Démarche de la statistique inférentielle Objectif : comparaison, adéquation, inférer par rapport à la population totale. A partir du plan expérimental : facteur et variables mesurées Identifier les types des variables : quantitative, qualitative, ordinale, séquentielle, … Faire des tests pour vérifier la cohérence des données Vérifier les distributions des variables, repérer les aberrants,… Poser les hypothèses H0 et H1 Choisir le tests statistiques (test t ou anova)

  4. Démarche de la statistique inférentielle • Valider les conditions d’application de ces tests : • Test d’adéquation à la normalité (Shapiro, kolmogorov, …) • Si non normale : faire des transformations log, racine, …. • Test d’ homogénéitédes variances tests de Bartlett • Choisir la méthode la plus appropriée : Normalité et homogénéité => Anova Normalité et non homogénéité => tests non paramétriques Non Normalité et non homogénéité et normalité des résidus => Anova Non Normalité, non homogène et non normalité des résidus => tests non paramétriques

  5. Démarche de la statistique inférentielle • Calcul d’un « indicateur statistique » : t de Student, F de Fisher en ANOVA. Valeur observée de l’indicateur sur les variables mesurées lors de l’expérience sur l’échantillon sélectionné. • Comparaison de la valeur observée de cet indicateur à la distribution théorique de cet indicateur. Quelle est la probabilité de trouver une valeur théorique supérieure à la valeur observée. La probabilité est le seuil de rejet ou non de l’hypothèse H0. • Si P(Vt > Vo)= 0,01, rejet de H0 avec un risque de 1%. Les moyennes comparées sont significativement différentes, mais cette affirmation peut être fausse dans 1% des cas. • Si P(Vt > Vo)= 0,15, le risque de se tromper en rejetant H0 est de 15% , risque de se tromper trop important.

  6. La démarche quantitative les méthodes • Les objectifs • Décrire • Tester l’adéquation • Tester l’indépendance • Comparer • Etudier la liaison • Modéliser • Résumer un ensemble de données • Classifier des données • Les lois de distribution • Normale • Poisson • Binomiale • …

  7. La démarche quantitative les méthodes : objectif et variables dépendantes

  8. La démarche quantitative les méthodes

  9. La démarche quantitative Variables quantitatives • Analyse de variance • Comparaisons de moyennes en prenant en considération les variances dans les groupes et entre les groupes. • Une comparaison des moyennes selon les facteurs expérimentaux et de leurs interactions • Décomposition de la variance • Variance totale • Variances liées aux facteurs (moyenne du facteur-moyenne globale) • Variance résiduelle • Rapport des variances des facteurs/la variance résiduelle • Test de Fischer : rapport de la variance expliquée par les facteurs et la variance résiduelle. • Le test de Fischer à deux valeurs pour le degré de liberté (nombre de niveaux des facteurs -1, nombre d’individus – nombre de facteurs)

  10. Analyse de variance « intuitive »

  11. La démarche quantitative Test de la normalité • Les tests statistiques paramétriques sont valables quand la loi de distribution suit une loi normale. • Les manières de tester l’adéquation à la loi normale • Les histogrammes • Les indicateurs • Coefficient d’assymétrie et d’applatissement • Test Kolmogorov Smirnov • Test Shapiro • ….. (exemple sur Tanagra – lecture des tests) • Les solutions quand la distribution n’est pas normale • 1 - transformer les variables : • Fonctions utilisées : Log népérien, Racine, Arcsinus • Vérifier la normalité de ces variables transformées • Utiliser des tests paramétriques • 2 – utiliser des tests non paramétriques ou de rangs • 3 – Faire de l’anova et tester la loi de distribution des résidus

  12. La démarche quantitative exemple d’analyse de variance • Expérience sur Diagelec : Outils de diagnostic • Deux facteurs expérimentaux : • Des outils d’évaluation D2,D3,D4,D5,D6,D7 • Des types à évaluer : connaissance, compétences, erreur • Une variable « degré de croyance qui varie de 0 à 4 »

  13. La démarche quantitative exemple d’analyse de variance Signification du modèle Signification des facteurs Où se trouve les différences ? Tests de Tukey

  14. La démarche quantitative • Comparaison entre les modalités Tests de Tukey ou de Wilcoxon • Différence franchement significative HSD • Comparer les niveaux de facteurs entre eux. 13 Octobre 2009 Conférence IHM 2009, Grenoble.

  15. La démarche quantitative exemple d’analyse de variance

  16. La démarche quantitative Les tests non paramétriques ou tests de rangs Les calculs statistiques ne sont plus faits sur les valeurs des variables Les indicateurs classiques comme la moyenne et écart type ne sont pas utilisés On utilise le rang des valeurs Les valeurs de la variable à étudier sont triées par ordre croissant et ensuite une nouvelle variable est créé qui est le rang de la valeur Ces rangs servent alors de variables Travaille sur la moyenne des rangs

  17. La démarche quantitative Les tests non paramétriques ou tests de rangs Définition des variables et facteurs Exercice avec les données H0 : le temps de réalisation des traits est égale quelque soit l’outil de positionnement et de sélection utilisé H1 : le temps de réalisation des traits est différente selon l’outil de positionnement et de sélection utilisé Sur Tanagra Test de la normalité Comparaison de moyennes avec deux facteurs expérimentaux avec le test de Kruskall et Wallis

  18. Test de rang de Kruskall et Wallis expé TouchOver

  19. La démarche quantitative Analyse de l’indépendance par le test du Chi2 Deux variables qualitatives Nombre de modalités restreintes Indépendance et pas de corrélation

  20. La démarche quantitative Etude de l’indépendance Quatre tuteurs qui réalisent des actions sur une interface qui comportent trois niveaux d’utilisation Au préalable les tuteurs sont interrogés sur leur pratique de suivi d’une classe de TP sans outil informatique Les actions sont enregistrées => un fichier de traces

  21. La démarche quantitative Etude de l’indépendance Equipe Metah Source : « Expérimentation d’un environnement flexible pour la supervision de travaux pratiques basés sur des simulations » Viviane Guéraud, Jean-Michel Adam, Anne Lejeune, Nadine Mandran, Nicolas Vézian, Michel Dubois, EIAH 2009.

  22. La démarche quantitative Etude de l’indépendance Equipe Metah

  23. La démarche quantitative Etude de l’indépendance Le tableau croisé : Fréquence

  24. La démarche quantitative Etude de l’indépendance Le tableau croisé : % total

  25. La démarche quantitative Etude de l’indépendance Le tableau croisé : % ligne

  26. La démarche quantitative Etude de l’indépendance Le tableau croisé : % colonne

  27. La démarche quantitative Etude de l’indépendance % action à un niveau donné pour un tuteur % action totale pour un tuteur Gérard a fait 597 actions sur 2303 soit 25.9% des actions totales Parmi les actions qu’il a faites 75% sont faites au niveau 2 (452/597) => Sur représentation en niveau 2 versus sous représentation en niveau 1

  28. La démarche quantitative Etude de l’indépendance • Le test d’indépendance • H0 : indépendance entre tuteurs et niveaux • Clics au hasard sur l’interface • Une même utilisation • H1 : Liaison entre les tuteurs et les niveaux • Une utilisation différente selon les tuteurs • La grandeur statistique : Chi2 de Pearson 13 Octobre 2009 Conférence IHM 2009, Grenoble.

  29. La démarche quantitative Etude de l’indépendance

  30. Tests d’indépendance Chi2

  31. La démarche quantitative L’étude de la liaison entre deux variables quantitatives Durée M3 Durée M1

  32. La démarche quantitative L’étude de la liaison entre deux variables quantitatives • Objectifs : • Etudier la liaison entre deux variables numériques • Coefficient de corrélation linéaire • Un test de signification associé • Un coefficient compris entre -1 et 1 • H0 : le coefficient est égale à 0 • H1 : le coefficient est différent de 0 Te

  33. La démarche quantitative La régression • Objectifs : • Modéliser la liaison entre deux ou plusieurs variables numériques : y=ax+b • Estimation d’une valeur prédite et d’une valeur résiduelle • Deux tests statistiques : • Global sur le modèle • H0 : Il n’existe pas de modèle • H1 : Il existe un modèle • Sur les coefficients • H0 : les coefficients sont égaux à 0 • H1 : les coefficients sont différents de 0 • Analyser les résidus : graphes de nuages de points

  34. La démarche quantitative La régression

  35. La démarche quantitative La régression

  36. Les méthodes d’analyses factorielles A partir d’un grand volumes de données, extraire des axes factoriels qui permettent de résumé l’information A partir de ces axes faire de la classification des données

  37. Un exemple : Analyse des correspondances multiples ACM Source Michel Tenenhaus

  38. Chien de taille moyenne , rapide Petit Chien Grand chien lourd, très rapide Chien de taille moyenne , pas rapide

  39. Classification A partir d’une distance entre les points, regroupement des individus selon des critères de proximité ou d’éloignement.

  40. Classification Sur des questions ouvertes

  41. La démarche quantitative Logiciels statistiques SAS R Tanagra Spad Sphinx Modalisa SPSS DTM Chic …. ….

  42. La démarche quantitative Que retenir …. • Les stats n’ont rien d’obligatoire • Fixer un plan expérimental a priori • Variables indépendantes • Variables dépendantes • L’unité statistique • Produire les données en respectant le plan expérimental • Créer les indicateurs pour l’analyse • Valider les données et tester l’adéquation aux lois (normale) • Indicateurs de base • Graphiques • Poser les questions auxquelles les stats doivent répondre • Choisir la méthode appropriée

  43. Conclusion Pas de solution clé en main Explorer les méthodes des SHS et des autres disciplines Les stats n’ont rien d’obligatoire Imaginer des combinaisons de méthodes originales et l’enchainement d’étapes qualitative et quantitatives Des résultats de qualité avec des étapes essentielles Identifier les différentes dimensions à mesurer pour répondre aux problèmes Connaitre le contexte du produit ou du concept Poser les hypothèses et/ou questions de recherche Construire et rédiger protocole expérimental Cibler les BONS sujets et les recruter Produire le matériel expérimental Etablir un planning de réalisation de l’expérience Faire les expériences, produire les données Valider les données Analyser les données Rédiger les résultats Retourner aux hypothèses Faire la critique de l’expérience

More Related