290 likes | 578 Views
Metode şi Tehnici de Cercetare în Ştiinţele Sociale. Curs 7: Teste de semnificaţie. Scurta recapitulare. Pînă acum, am văzut că relaţiile dintre două variabile numerice pot fi sintetizate sub forma unor coeficienti (de regresie, de corelaţie Pearson etc).
E N D
Metode şi Tehnici de Cercetare în Ştiinţele Sociale Curs 7: Teste de semnificaţie
Scurta recapitulare • Pînă acum, am văzut că relaţiile dintre două variabile numerice pot fi sintetizate sub forma unor coeficienti (de regresie, de corelaţie Pearson etc). • Pînă acum, am stabilit ca fiecare coeficient are o anumită valoare (de obicei între -1 şi +1, şi un semn (+ sau –).
Teste de semnificaţie a asocierii • Însă relaţiile dintre variabile mai conţin o alta informaţie care este esenţială pentru cercetători: semnificaţia statistică. • Întrebarea principală este “cît de credibilă este relaţia pe care noi am decoperit-o?” • Acest răspuns poate fi dat prin apelul la teoria probabilităţilor.
Curba normală • Atunci cînd folosim date cantitative şi avem o populaţie mare ca observaţii (>100, în general), putem asuma că distribuţia valorilor acestei populaţii va urma o curba normală (recapitulaţi curba normală!). • Ex: distribuţia înălţimii tuturor studenţilor din Univ. Danubius. • O curbă normală are media = mediana = modul.
Curba normală • De asemenea, ştim că în cazul unei curbe normale: • 68,26% din cazuri sunt distribuite în jurul mediei, în intervalul [-1S.D.; +1S.D.] • 95,44% din cazuri sunt distribuite în jurul mediei, în intervalul [-2SD; +2SD] • 99,72% din cazuri sunt distribuite în jurul mediei, în intervalul [-3SD; +3SD] • Ea ne permite să transformăm fiecare valoare măsurată de noi într-un scor numit Z care ne spune cît de departe de medie este acea valoare, măsurînd această distanţă în valori ale abaterii standard.
Curba normală şi probabilitaţi • Curba normală poate fi înţeleasă şi apelînd la teoria probabilităţilor. • Ex: reamintiţi-vă aruncatul a 5 monede de sute de ori -> distribuţia va fi normală, în sensul ca majoritatea distribuţiilor vor avea 3 capete sau pajure şi 2 capete şi pajure şi mult mai puţine vor fi 5 capete sau 5 pajure. • Asumţia este că fiecare alternativă are aceeaşi probabilitate de apariţie.
Curba normală şi probabilitaţi • Dacă măsurăm înălţimea celor 3000 de studenţi Danubius, ne asteptăm să obţinem o curbă normaă, adică majoritatea vor avea înălţimi apropiate de medie şi puţini vor avea înalţimi foarte mici sau foarte mari. • Fiecare înălţime poate fi transformată într-un scor Z, dacă ştim Media şi Abaterea (deviaţia) standard.
Scorul Z • Z = (X – Ū)/s, unde • Z este scorul valorii standardizate • X este valoare pe care o transformăm • Ū este media populaţiei • s este deviaţia standard (recapitulare!) • Scorul Z ne va spune cît de departe faţă de medie, în valori ale deviaţiei standard, este valoarea X.
Ex. Calculare a scorului Z • Presupunem că înălţimea medie a studenţilor Danubius este 170 iar deviaţia standard este 10. Cît % din cazuri au o înălţime de mai mică de 150cm? • Z = (150-170)/10 =- 2SD. • Cineva cu înălţimea de 150 va fi la 2 unităţi de deviaţie standard de media (170). • Ştiind probabilităţile de distribuţie de la slide-ul 5, putem calcula cît la sută din studenţi vor avea mai puţin de 150cm ca înălţime.
Ex. Calculare a scorului Z • Avem 2 segmente (-infinit; -2SD) şi (-2SD; + infinit). • Ştim că între [-2SD; +2SD] sunt 95,44% din cazuri. Restul de cazuri înseamnă 4,56% din cazuri, dintre care jumătate repartizate după + 2SD, iar cealaltă sub -2SD. • Noi suntem interesaţi de valorile mai jos de -2SD, deci de 4,56/2 = 2,28% (sau 0,023).
Ex. Calculare a scorului Z • Pin urmare 2,28% din studenţii Danubius vor avea înălţimi sub 150cm, un procent foarte mic. • De asemenea, se poate obţine scorul Z dacă ştim acest procent, folosind un tabel de valori Z, disponibil în orice carte de statistică socială (de ex. În cartea lui R. King 2005, pg. 261). • Vrem să calculăm care e scorul Z pentru procentul de 2,28 (sau 0,0228 pe care îl putem aproxima la 0,023).
Ex. Calculare a scorului Z • Mergînd în Tabelul de la pg. 261, cautăm în tabel valoarea 0,023, pe care o găsim îm dreptul coloanei Z = 2.00. • De ex., o probabilitate de 0,076 (sau 7,6%) are un scor Z=1,43.
Testul de semnificaţie Z • Testul (scorul) Z e important cînd nu lucrăm cu toată populaţia, ci cu eşantioane! • Acest test ne spune care este nivelul de încredere că rezultatul nostru poate fi extrapolat la nivelul populaţiei totale. • Noi nu suntem interesaţi în valorile propriu-zise ale eşantionului, ci vrem să folosim aceste valori pt a caracteriza populaţia totală.
Probabilitatea de eroare • Întotdeauna cînd lucrăm cu un eşantion, în loc de populaţie, există o probabilitate să avem un rezultat eronat, din diferite motive. • Este important însă ca această probabilitate de eroare să fie cît mai mică. • Tipic, probabilitatea de eroare trebuie să fie mai mică de 0.05 (sau 5%). Aceasta este o convenţie între cercetători.
Probabilitatea de eroare • Alteori se folosesc probabilităţi de eroare mai mici. • Ex. 0,01 (1%) sau chiar 0,001 (0,1%). • Dacă lucrăm cu probabilitate de 0,05, înseamnă că trebuie să vedem dacă valoarea Z pe care noi o găsim este înăuntrul sau în afara intervalului delimitat de valorile Z pentru ± 0.025 (0.05/2).
Z-critic • Acest Z dat de valoarea ± 0,025, se numeşte Z-critic şi, uitîndu-ne pe tabelul de valori Z, observăm că ia valoarea Z = ±1,96. • Această valoare este foarte importantă, deoarece ne spune că există 5% (0,025 X 2) şanse să obţinem un rezultat în afara intervalului (-1,96; +1,96).
Ipoteza nulă • Întotdeauna cînd cercetăm o relaţie între 2 sau m.m. variabile, plecăm de la ipoteza nulă care spune că nu este nici o relaţie între variabile. • Dacă putem respinge ipoteza nulă, atunci implicit susţinem ipoteza că există o relaţie între cele 2 sau m.m. variabile.
Exemplu • Să presupunem că un cercetător măsoară media generală a unui eşantion de 100 de studenţi RISE şi doreşte să-l compare cu media generală a Universităţii Danubius. • Ştim că media generală pe Danubius este 7.5, cu o deviaţie standard de 1,5. • Media eşantionului de 100 de studenţi RISE este 8,5.
Ex. Întrebarea de cercetare • Intrebarea noastră de cercetare este dacă nu cumva studenţii RISE sunt mai performanţi academic decît ceilalţi studenţi. • Observaţi că în cazul studenţilor Universităţii, lucrăm cu toată populaţia, în timp ce la RISE lucrăm cu eşantion. • Este adevărat că studenţii RISE sunt în medie mai buni decît ceilalţi studenţi Danubius?
Ipoteza nulă • Ea spune că NU ESTE ADEVĂRAT CĂ STUDENŢII RISE SUNT MAI BUNI DPDV ACADEMIC. • O putem respinge dacă vom calcula distribuţia probabilităţilor, prin identificarea valorilor Z şi a lui Z-critic. • Să presupunem că dorim să stabilim o probabilitate de eroare de 0.05 (cu Z-critic de ±1,96).
Calcul Z şi Z-critic • Pentru a afla Z, apelăm la o formulă un pic modificată faţă de cea anterioară (slide 8): • Z = (X – Ū)/(s/√N), unde • X este media eşantionului (studenţii RISE) • Ū este media populaţiei (studenţii Danubius) • s este deviaţia standard a populaţiei (Danubius) • N este numărul eşantionului (RISE).
Este vreo diferenţă? • Dacă nu este nici o diferenţă între eşantion şi populaţie, atunci valoarea Z va fi în interiorul intervalului (-1.96;+1,96). • Z = (8,5-7,5)/(1,5/√100) = 1/(1,5/10) = 1/0,15 = 6,6 • Z-critic este de 1,96 • Z=6,6 cade în afara intervalului critic (vezi slidul anterior).
Concluzia • Există o diferenţă între studenţii de la RISE şi ceilalţi studenţi: RISE au sistematic medii mai bune, poate din cauza selecţiei mai bune sau chiar a profesorilor mai buni, inclusiv a celui de Metode şi Tehnici de Cercetare Socială
Alte observaţii • Există mai multe teste de semnificaţie • Testul t (Student): pentru eşantioane mici • Testul F, pt ANOVA (o tehnică statistică) • Chi, pt variabile la nivel nominal. • Trebuie să citiţi suplimentar despre aceste teste pt a le înţelege (important!) • Pentru testul Z şi t, citiţi King (2005, 255-271).
IMPORTANT! • Acest curs nu intră în programa d-voastră de examen. • DAR! • Este important să înţelegeţi mecanismul semnificaţiei statistice dacă vreţi să întelegeţi şi să aplicaţi statistica socială.
Alte posibile lecturi individuale • Traian Rotaru, Gabriel Bădescu, Irina Culic, Elemer Mezei, Cornelia Mureşan. 1999. Metode Statistice Aplicate în Ştiinţele Sociale. Iaşi: Polirom. • O carte generală de statistică aplicată • Exemple bune • Explicarea modului de utilizare a SPSS.
Remarci finale • Mulţumesc de participare, succes în sesiune, bafta la examenul de MTCS!