1 / 27

Metode şi Tehnici de Cercetare în Ştiinţele Sociale

Metode şi Tehnici de Cercetare în Ştiinţele Sociale. Curs 7: Teste de semnificaţie. Scurta recapitulare. Pînă acum, am văzut că relaţiile dintre două variabile numerice pot fi sintetizate sub forma unor coeficienti (de regresie, de corelaţie Pearson etc).

hasana
Download Presentation

Metode şi Tehnici de Cercetare în Ştiinţele Sociale

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Metode şi Tehnici de Cercetare în Ştiinţele Sociale Curs 7: Teste de semnificaţie

  2. Scurta recapitulare • Pînă acum, am văzut că relaţiile dintre două variabile numerice pot fi sintetizate sub forma unor coeficienti (de regresie, de corelaţie Pearson etc). • Pînă acum, am stabilit ca fiecare coeficient are o anumită valoare (de obicei între -1 şi +1, şi un semn (+ sau –).

  3. Teste de semnificaţie a asocierii • Însă relaţiile dintre variabile mai conţin o alta informaţie care este esenţială pentru cercetători: semnificaţia statistică. • Întrebarea principală este “cît de credibilă este relaţia pe care noi am decoperit-o?” • Acest răspuns poate fi dat prin apelul la teoria probabilităţilor.

  4. Curba normală • Atunci cînd folosim date cantitative şi avem o populaţie mare ca observaţii (>100, în general), putem asuma că distribuţia valorilor acestei populaţii va urma o curba normală (recapitulaţi curba normală!). • Ex: distribuţia înălţimii tuturor studenţilor din Univ. Danubius. • O curbă normală are media = mediana = modul.

  5. Curba normală • De asemenea, ştim că în cazul unei curbe normale: • 68,26% din cazuri sunt distribuite în jurul mediei, în intervalul [-1S.D.; +1S.D.] • 95,44% din cazuri sunt distribuite în jurul mediei, în intervalul [-2SD; +2SD] • 99,72% din cazuri sunt distribuite în jurul mediei, în intervalul [-3SD; +3SD] • Ea ne permite să transformăm fiecare valoare măsurată de noi într-un scor numit Z care ne spune cît de departe de medie este acea valoare, măsurînd această distanţă în valori ale abaterii standard.

  6. Curba normală şi probabilitaţi • Curba normală poate fi înţeleasă şi apelînd la teoria probabilităţilor. • Ex: reamintiţi-vă aruncatul a 5 monede de sute de ori -> distribuţia va fi normală, în sensul ca majoritatea distribuţiilor vor avea 3 capete sau pajure şi 2 capete şi pajure şi mult mai puţine vor fi 5 capete sau 5 pajure. • Asumţia este că fiecare alternativă are aceeaşi probabilitate de apariţie.

  7. Curba normală şi probabilitaţi • Dacă măsurăm înălţimea celor 3000 de studenţi Danubius, ne asteptăm să obţinem o curbă normaă, adică majoritatea vor avea înălţimi apropiate de medie şi puţini vor avea înalţimi foarte mici sau foarte mari. • Fiecare înălţime poate fi transformată într-un scor Z, dacă ştim Media şi Abaterea (deviaţia) standard.

  8. Scorul Z • Z = (X – Ū)/s, unde • Z este scorul valorii standardizate • X este valoare pe care o transformăm • Ū este media populaţiei • s este deviaţia standard (recapitulare!) • Scorul Z ne va spune cît de departe faţă de medie, în valori ale deviaţiei standard, este valoarea X.

  9. Ex. Calculare a scorului Z • Presupunem că înălţimea medie a studenţilor Danubius este 170 iar deviaţia standard este 10. Cît % din cazuri au o înălţime de mai mică de 150cm? • Z = (150-170)/10 =- 2SD. • Cineva cu înălţimea de 150 va fi la 2 unităţi de deviaţie standard de media (170). • Ştiind probabilităţile de distribuţie de la slide-ul 5, putem calcula cît la sută din studenţi vor avea mai puţin de 150cm ca înălţime.

  10. Ex. Calculare a scorului Z • Avem 2 segmente (-infinit; -2SD) şi (-2SD; + infinit). • Ştim că între [-2SD; +2SD] sunt 95,44% din cazuri. Restul de cazuri înseamnă 4,56% din cazuri, dintre care jumătate repartizate după + 2SD, iar cealaltă sub -2SD. • Noi suntem interesaţi de valorile mai jos de -2SD, deci de 4,56/2 = 2,28% (sau 0,023).

  11. Ex. Calculare a scorului Z • Pin urmare 2,28% din studenţii Danubius vor avea înălţimi sub 150cm, un procent foarte mic. • De asemenea, se poate obţine scorul Z dacă ştim acest procent, folosind un tabel de valori Z, disponibil în orice carte de statistică socială (de ex. În cartea lui R. King 2005, pg. 261). • Vrem să calculăm care e scorul Z pentru procentul de 2,28 (sau 0,0228 pe care îl putem aproxima la 0,023).

  12. Ex. Calculare a scorului Z • Mergînd în Tabelul de la pg. 261, cautăm în tabel valoarea 0,023, pe care o găsim îm dreptul coloanei Z = 2.00. • De ex., o probabilitate de 0,076 (sau 7,6%) are un scor Z=1,43.

  13. Testul de semnificaţie Z • Testul (scorul) Z e important cînd nu lucrăm cu toată populaţia, ci cu eşantioane! • Acest test ne spune care este nivelul de încredere că rezultatul nostru poate fi extrapolat la nivelul populaţiei totale. • Noi nu suntem interesaţi în valorile propriu-zise ale eşantionului, ci vrem să folosim aceste valori pt a caracteriza populaţia totală.

  14. Probabilitatea de eroare • Întotdeauna cînd lucrăm cu un eşantion, în loc de populaţie, există o probabilitate să avem un rezultat eronat, din diferite motive. • Este important însă ca această probabilitate de eroare să fie cît mai mică. • Tipic, probabilitatea de eroare trebuie să fie mai mică de 0.05 (sau 5%). Aceasta este o convenţie între cercetători.

  15. Probabilitatea de eroare • Alteori se folosesc probabilităţi de eroare mai mici. • Ex. 0,01 (1%) sau chiar 0,001 (0,1%). • Dacă lucrăm cu probabilitate de 0,05, înseamnă că trebuie să vedem dacă valoarea Z pe care noi o găsim este înăuntrul sau în afara intervalului delimitat de valorile Z pentru ± 0.025 (0.05/2).

  16. Z-critic • Acest Z dat de valoarea ± 0,025, se numeşte Z-critic şi, uitîndu-ne pe tabelul de valori Z, observăm că ia valoarea Z = ±1,96. • Această valoare este foarte importantă, deoarece ne spune că există 5% (0,025 X 2) şanse să obţinem un rezultat în afara intervalului (-1,96; +1,96).

  17. Ipoteza nulă • Întotdeauna cînd cercetăm o relaţie între 2 sau m.m. variabile, plecăm de la ipoteza nulă care spune că nu este nici o relaţie între variabile. • Dacă putem respinge ipoteza nulă, atunci implicit susţinem ipoteza că există o relaţie între cele 2 sau m.m. variabile.

  18. Exemplu • Să presupunem că un cercetător măsoară media generală a unui eşantion de 100 de studenţi RISE şi doreşte să-l compare cu media generală a Universităţii Danubius. • Ştim că media generală pe Danubius este 7.5, cu o deviaţie standard de 1,5. • Media eşantionului de 100 de studenţi RISE este 8,5.

  19. Ex. Întrebarea de cercetare • Intrebarea noastră de cercetare este dacă nu cumva studenţii RISE sunt mai performanţi academic decît ceilalţi studenţi. • Observaţi că în cazul studenţilor Universităţii, lucrăm cu toată populaţia, în timp ce la RISE lucrăm cu eşantion. • Este adevărat că studenţii RISE sunt în medie mai buni decît ceilalţi studenţi Danubius?

  20. Ipoteza nulă • Ea spune că NU ESTE ADEVĂRAT CĂ STUDENŢII RISE SUNT MAI BUNI DPDV ACADEMIC. • O putem respinge dacă vom calcula distribuţia probabilităţilor, prin identificarea valorilor Z şi a lui Z-critic. • Să presupunem că dorim să stabilim o probabilitate de eroare de 0.05 (cu Z-critic de ±1,96).

  21. Calcul Z şi Z-critic • Pentru a afla Z, apelăm la o formulă un pic modificată faţă de cea anterioară (slide 8): • Z = (X – Ū)/(s/√N), unde • X este media eşantionului (studenţii RISE) • Ū este media populaţiei (studenţii Danubius) • s este deviaţia standard a populaţiei (Danubius) • N este numărul eşantionului (RISE).

  22. Este vreo diferenţă? • Dacă nu este nici o diferenţă între eşantion şi populaţie, atunci valoarea Z va fi în interiorul intervalului (-1.96;+1,96). • Z = (8,5-7,5)/(1,5/√100) = 1/(1,5/10) = 1/0,15 = 6,6 • Z-critic este de 1,96 • Z=6,6 cade în afara intervalului critic (vezi slidul anterior).

  23. Concluzia • Există o diferenţă între studenţii de la RISE şi ceilalţi studenţi: RISE au sistematic medii mai bune, poate din cauza selecţiei mai bune sau chiar a profesorilor mai buni, inclusiv a celui de Metode şi Tehnici de Cercetare Socială 

  24. Alte observaţii • Există mai multe teste de semnificaţie • Testul t (Student): pentru eşantioane mici • Testul F, pt ANOVA (o tehnică statistică) • Chi, pt variabile la nivel nominal. • Trebuie să citiţi suplimentar despre aceste teste pt a le înţelege (important!) • Pentru testul Z şi t, citiţi King (2005, 255-271).

  25. IMPORTANT! • Acest curs nu intră în programa d-voastră de examen. • DAR! • Este important să înţelegeţi mecanismul semnificaţiei statistice dacă vreţi să întelegeţi şi să aplicaţi statistica socială.

  26. Alte posibile lecturi individuale • Traian Rotaru, Gabriel Bădescu, Irina Culic, Elemer Mezei, Cornelia Mureşan. 1999. Metode Statistice Aplicate în Ştiinţele Sociale. Iaşi: Polirom. • O carte generală de statistică aplicată • Exemple bune • Explicarea modului de utilizare a SPSS.

  27. Remarci finale • Mulţumesc de participare, succes în sesiune, bafta la examenul de MTCS!

More Related