1 / 51

Y - 7102 STATISTIQUE

PARAMTRES vs STATISTIQUES. Population est caractrise par des paramtres souvent inconnus que l'on doit estimer.Un chantillon est caractris par des statistiques ou des estims.. Moyenne et cart-type. Population: moyenne= m = S X/N cart-type s = S(X-m)2/(N)chantillon: moye

hue
Download Presentation

Y - 7102 STATISTIQUE

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


    1. Y - 7102 STATISTIQUE

    2. PARAMÈTRES vs STATISTIQUES Population est caractérisée par des paramètres souvent inconnus que l ’on doit estimer. Un échantillon est caractérisé par des statistiques ou des estimés.

    3. Moyenne et écart-type Population: moyenne= m = S X/N écart-type s = S(X-m)2/(N) Échantillon: moyenne=X = S X/N écart-type s = S(X-X)2/(N-1)

    4. s = S(X-X)2/(N-1) Pourquoi N-1? Supposons une moyenne de population de 5. Si je prends 5 chiffres (donc un échantillon de 4 sujets) et que ma moyenne de population est 5, le 5e chiffre de ma distribution est fixé par les 4 autres: (1+4+7+?+2)/5=5 (14+?)=25 ?=25-14=11. Chaque fois que je prendrai une nouvelle distribution, mon 5e chiffre sera dépendant des autres. Donc je peux le prédire avec les autres et la moyenne fixée. Il n ’est pas indépendant.

    5. Moyenne et écart-type du nombre de mets dans la population

    6. Moyenne des moyennes

    7. Erreur type et écart-type Erreur-type: « écart-type » de la distribution des moyennes (standard error of mean: SEM) s (SEM) = s/ VN Écart-type d’ une distribution des données d’ un échantillon s = VS(X-X)2/(N-1)

    8. Erreur-type vs écart-type L ’erreur-type est la moyenne du carré des écarts entre les différentes valeurs possibles des X des échantillons et la moyenne de la population m. S(X-m)2 N Erreur -type: est fonction de l ’écart-type et du N. Plus N est grand, plus l’erreur-type (SEM= standard error of mean) est petit.

    9. Erreur type et écart type Erreur type (ET) = indice de variabilité des moyennes par rapport à la moyenne m de la population. Un > erreur type = échantillon moins représentatif. Conclusions tirées risquent d ’être fausses dans population.

    10. Écart type (ÉT) Moyenne du carré des écarts entre les scores et la moyenne de l ’échantillon. Indice de variabilité des scores autour de moyenne de échantillon: X sorte de moyenne des distances de chaque sujet par rapport à la moyenne du groupe s= VS(X-X)2/(N-1)

    11. Représentation géométrique de ÉT

    12. Différence entre ErT et ÉcT dans la notation Supposons: N=100, X =8.5, s=2.5 X = 8.5±2 (sd): 95% des sujets de l ’échantillon sont entre 3.5 (8.5-2(2.5))et 13(8.5+2(2.5)). X=8.5 ±2(SEm): 95% de chance que la moyenne de population soit entre 8 (8.5-2(.25)) et 9 (8.5+2(.25)).

    13. Présentation graphique avec les erreurs-types

    14. Présentation graphique avec les écart-types

    16. Étapes de l ’inférence statistique 1- Sélection d’un échantillon aléatoire représentatif de la population. 2- Répartition aléatoire des sujets en groupes expérimental et contrôle. 3- Formulation de l ’hypothèse de recherche.

    17. Étapes de l’ inférence statistique 4- Formulation de l ’hypothèse nulle et des hypothèses alternatives. 5- Choix du seuil alpha ainsi que de la puissance. 7- Inférence à partir des résultats du test statistique.

    18. Sélection et répartition aléatoire

    19. Hypothèse de recherche Le groupe recevant le bêta bloqueur aura une meilleure performance à l ’effort, telle que mesurée par le tapis roulant.

    20. Formulation des hypothèses nulle et alternative

    22. Hypothèse nulle Hypothèse nulle = le hasard seul amènerait aucune différence entre les groupes. On cherche à réfuter Ho. Pourquoi poser Ho? Il est impossible de savoir ce qui arriverait dans la population. On assume Ho vrai jusqu’à preuve du contraire.

    23. Bicaudal vs unicaudal (bidirectionnel vs unidirectionnel (one tail vs two tails) Rejet de Ho = acceptation de Ha. UNICAUDAL= une seule possibilité. Le groupe expérimental ne peut pas être pire que le contrôle BICAUDAL= le groupe expérimental peut être meilleur mais pourrait être pire!!!!

    24. Unicaudal Situation à utiliser avec précaution. On doit s ’appuyer sur la littérature ou sur une argumentation clinique solide pour négliger une des possibilités. Si cela est possible, il y a augmentation de puissance

    25. Probabilité d’apparition d’une valeur de z, avec distribution dont la moyenne est 0

    26. Bicaudal vs unicaudal (bidirectionnel vs unidirectionnel (one tail vs two tails)

    27. Rejet de Ho L ’hypothèse de recherche doit spécifier une direction. Le rejet de Ho amène acception de Ha. Non rejet de Ho n ’est pas confirmation de Ho. On ne confirme jamais Ho puisqu’elle est postulée vraie au départ. On ne peut que la rejeter ou non. Conclusion: étant donné taille de l ’échantillon, sa représentativité et la taille de l ’effet de traitement, on ne peut rejeter Ho.

    28. Erreur a et erreur b Rejet de Ho (me=mc) peut occasionner ERREUR ALPHA ou de type I. Erreur alpha: conclure que le traitement est efficace alors qu’il ne l’est pas. Coût: donné à une clientèle un traitement potentiellement inutile ou dangereux.

    29. Erreur a et erreur b Non rejet de Ho (me<mc, me>mc): ERREUR BETA ou de type II. Erreur beta: conclure que le traitement n ’est pas efficace alors qu’il l ’est. Coût: priver une clientèle d ’un traitement potentiellement utile.

    30. Erreur a et erreur b

    31. Conclusion sur les erreurs Types d ’erreurs: Type I: rejeter par erreur l ’hypothèse nulle type II: accepter par erreur l ’hypothèse nulle type III: résoudre le mauvais problème au mauvais moment dans la mauvaise organisation et par la mauvaise personne. (Mitroff, 1977) (error of the third kind) Type IV: poser des questions pour identifier un problème mal défini, quand la nature vraie ou fausse des questions est indéterminée au sens absolu. (Loveridge, 1997) (error of the fourth kind)

    32. PUISSANCE Probabilité de rejeter Ho si elle est fausse. Probabilité de détecter une différence significative alors qu’il y a un effet. C’est le contraire de erreur Beta. Choix du seuil a = niveau de probabilité de rejeter Ho. Ho toujours assumée vraie, on veut n ’avoir que 5% ou 1% de chance d ’observer une différence de taille Y.

    33. Seuil alpha .05 Si Ho était vraie, 5% de chances d ’obtenir une différence de taille Y. 5% de chances de rejeter Ho vraie avec une différence de taille Y. 95% de chances de ne pas rejeter Ho si elle est vraie, avec une différence de taille < Y. Seuil alpha est décidé a priori. Fonction du coût de l ’erreur alpha. Voir document PDF 1

    34. «Winer: « When the power of a test is likely to be low under these levels of significance (0,05 or 0,01), and when the type 1 and the type 2 errors are of approximately equal importance, the 0.30 and 0,20 levels of significance may be more appropriate than the 0,05 and 0,01 levels” p.14). Cohen mentionne que dans de telles conditions, le rapport erreur Bêta / erreur Alpha devrait plutôt tendre vers 1 . Winer, Statistical principles in experimental design. second edition ed. 1971, New York: McGraw-Hill. Cohen, Statistical power analysis for the behavioural sciences. 1969, New York: Academic Press.

    35. Puissance et seuil b Un seuil de b .20 = 20% de chance de ne pas rejeter Ho alors qu’elle est fausse, 80% de pouvoir rejeter Ho alors qu’elle est fausse, 80% de chance de pouvoir détecter une différence significative à un seuil a donné = PUISSANCE

    36. Exemple (niveau de dépression sur l’Inventaire de dépression de Beck

    37. Relation entre a, b et puissance Choix de a sous décision du chercheur, selon le coût de a. a plus sévère la puissance car + difficile d’obtenir une différence significative à .001 qu’à .05.

    38. Facteurs influençant la puissance Le seuil alpha choisi: seuil moins sévère (0.10 ou 0.05 au lieu de 0.01) puissance. Plus l’effet de traitement (D) est grand plus la puissance . Plus l’écart-type(s) est petit, plus la puissance . Plus la taille du N (avec seuil a, s et D constant) plus la puissance .

    39. Calcul de la taille de l’effet (effect size) Pour une différence de moyenne entre deux groupes: «d» de Cohen: (µ1 - µ2)/ s combinés «g» de Hedges: (M1 - M2)/ s combinés «r» de Pearson: corrélation: voir PDF document 2.

    40. Critères pour choisir une taille d ’effet, a priori Recherches antérieures: examiner les moyennes et écart type données dans les études. Différence jugée cliniquement intéressante ou importante: épidémiologie vs recherche clinique. Convention: petit, moyen grand: 0.20, 0.50, 0.80

    43. Calcul de la puissance Calcul de delta d pour une moyenne: d = d ? ? N d = moy. 1 - moy. population moyenne des écarts type Calcul de d pour 2 moyennes: d = d ? ? N/2

    44. Calcul de la puissance Calcul de d pour échantillons reliés: d =d /? N ou d =moy. 1 - moy. 2 s x1-x2 et s (x1-x2)= s ? 2(1-r)

    45. Calcul de la taille d’échantillon nécessaire En se servant de la table, on trouve le d qui correspond à la puissance recherchée pour un seuil alpha donné. Ex: 80% à 0,05 donne un d de 2.8. Dans la formule: N = 2(d/d)2 si d=0,5 on a: N=2(2.8/0,5)2 =63 sujets

    46. Calcul du nombre initial pour contrôler la perte de sujets Faire le calcul de puissance selon les besoins de l’étude. Appliquez la formule: Ni = N / (1-Pd) Ni = nombre initial N = nombre calculé sans perte Pd = probabilité de perte

    47. Logiciels calcul de puisance Review of statistical power analysis software http://www.zoology.ubc.ca/~krebs/power.html GPOWER http://www.psycho.uni-duesseldorf.de/aap/projects/gpower/index.html PASS 2000 power analysis http://www.ncss.com/passinfo.html NQuery http://www.statsol.ie/index.html Power and Precision http://www.power-analysis.com/

    49. Background Given an observed test statistic and its degrees of freedom, one may compute the observed P value with most statistical packages. It is unknown to what extent test statistics and P values are congruent in published medical papers.

    50. Methods We checked the congruence of statistical results reported in all the papers of volumes 409–412 of Nature (2001) and a random sample of 63 results from volumes 322–323 of BMJ (2001). We also tested whether the frequencies of the last digit of a sample of 610 test statistics deviated from a uniform distribution (i.e., equally probable digits).

    51. Results 11.6% (21 of 181) and 11.1% (7 of 63) of the statistical results published in Nature and BMJ respectively during 2001 were incongruent, probably mostly due to rounding, transcription, or type-setting errors. At least one such error appeared in 38% and 25% of the papers of Nature and BMJ, respectively. In 12% of the cases, the significance level might change one or more orders of magnitude. The frequencies of the last digit of statistics deviated from the uniform distribution and suggested digit preference in rounding and reporting.

    52. Conclusions This incongruence of test statistics and P values is another example that statistical practice is generally poor, even in the most renowned scientific journals, and that quality of papers should be more controlled and valued.

More Related