1 / 33

7. přednáška

7. přednáška. Základy testování hypotéz. Testování hypotéz. V kvantitativně orientovaných výzkumech ověřujeme hypotézy o vztazích mezi jevy – tzv. věcné hypotézy. Chlapci dosahují lepších výsledků ve fyzice než dívky. Operacionalizujeme - forma statistické hypotézy:

Download Presentation

7. přednáška

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 7. přednáška Základy testování hypotéz

  2. Testování hypotéz V kvantitativně orientovaných výzkumech ověřujeme hypotézy o vztazích mezi jevy – tzv. věcné hypotézy. • Chlapci dosahují lepších výsledků ve fyzice než dívky. Operacionalizujeme - forma statistické hypotézy: • Průměrný počet bodů v didaktickém testu z fyziky je u chlapců vyšší než průměrný počet bodů u dívek. Testování hypotéz - rozhodování • o platnosti nebo neplatnosti hypotézy vyslovené na základě pozorování na výběrovém souboru • předem dané riziko omylu o pravdivosti zkoumané hypotézy

  3. Nulová hypotéza Statistickou hypotézu ověřujeme proti nulové hypotéze. Nulová hypotéza = domněnka, která tvrdí, že mezi proměnnými, které zkoumáme, vztah není. Dokážeme-li, že nulová hypotéza neplatí, přijímáme alternativní hypotézu. H0: Chlapci i dívky budou dosahovat v didaktickém testu z fyziky stejných výsledků.

  4. Co zkoumáme? • Souvisejí spolu dané proměnné (jevy)? Jaké je riziko omylu pro přijetí této hypotézy? • statistické testy významnosti • Jestliže spolu jevy souvisejí, jak těsný je jejich vztah (míra závislosti mezi jevy)? • koeficienty korelace, regrese, kontingence, atd.

  5. Statistické testy významnosti Existuje mezi proměnnými statisticky významný (signifikantní) vztah? (Tj. je velmi nepravděpodobné, že by vztah vznikl náhodou.) Hladina významnosti = pravděpodobnost toho, že jsme neoprávněně odmítli nulovou hypotézu, tedy přijali hypotézu alternativní.

  6. Druhy statistický testů významnosti Týká se nulová hypotéza některého parametru rozdělení náhodné veličiny? • parametrické – vyžadují splnění řady předběžných podmínek, např. rozdělení náhodné veličiny určitého typu (nejčastěji normální) • neparametrické – např. když není znám typ rozdělení náhodné veličiny, jsou univerzálnější, ale mají menší schopnost rozeznat odchylky od nulové hypotézy /a mohou odmítnout nulovou hypotézu jako nesprávnou), vyžadují větší počet případů Jak jsme formulovali alternativní hypotézu? • např. nulová hypotéza typu a = b (a, aritmetický průměr skupiny A = b, aritmetickému průměru skupiny B); • alternativní hypotéza: a > b – jednostranné testy • alternativní hypotéza: a ≠ b – oboustranné testy

  7. Nominální, ordinální, kardinální? Podle proměnných, se kterými pracujeme: • proměnné nominální (několik navzájem se vylučujících hodnot, pracujeme většinou s jejich počty) • proměnné ordinální (jsou nominální proměnné, u nichž hraje roli hierarchické uspořádání) • proměnné kardinální (jsou všechny proměnné, které lze změřit)

  8. Analýza nominálních dat Test dobré shody chí-kvadrát ověřujeme, zda četnosti, které byly získány měřením, se odlišují od teoretických četností, které odpovídají dané nulové hypotéze Test nezávislosti chí-kvadrát pro kontingenční tabulku existuje souvislost mezi dvěma (pedagogickými) jevy, které byly zachyceny pomocí nominálního i ordinálního měření) Test nezávislosti chí-kvadrát pro čtyřpolní tabulku pro případy, že jevy, mezi kterými ověřujeme vztah, mohou nabývat pouze dvou altenativních kvalit Stupeň závislosti mezi jevy při nominálním měření např. koeficient kontingence

  9. Příklad - test dobré shody Chí-kvadrát (χ²) V určitém roce zemřelo v ČR na následky dopravních nehod 114 dětí. Tato úmrtí byla rozdělena do jednotlivých měsíců roku tak, jak uvádí tabulka. Je počet úmrtí ve všech měsících stejný? • H0 Počty úmrtí dětí při dopravních nehodách jsou v jednotlivých měsících roku stejné. • HA Počty úmrtí dětí při dopravních nehodách se v jednotlivých měsících roku liší. Příklad převzat z Chráska, 2007

  10. Postup při testování statistické hypotézy: • Stanovte druh testu • Zformulujte nulovou a alternativní hypotézu • Uveďte testové kritérium a stanovte počet stupňů volnosti - uvést vzorec • Vypočtěte testové kritérium • Nalezněte tabulkové hodnoty • Porovnejte vypočtené testové kritérium s tabulkovou hodnotou • Rozhodněte o nulové hypotéze • Zformulujte závěrečný výrok

  11. Co jsme vypočítali? Vypočítaná hodnota χ2 je 6,000. Ukazuje rozdílmezi pozorovanou a očekávanou četností. Při rozhodování o platnosti nulové hypotézy porovnáváme vypočítanou hodnotu testového kritéria s tzv. kritickou hodnotou. Příslušnou hodnotu hledáme v tabulkách • na zvolené hladině významnosti (pravděpodobnost nesprávného odmítnutí nulové hypotézy) – volíme podle situace • pro určitý počet stupňů volnosti = počet řádků v tabulce, kterým je možné teoreticky přiřknout libovolnou hodnotu (11 stupňů volnosti v našem případě) V tabulkách – kritická hodnota pro hladinu významnosti 0,05 a 11 stupňů volnosti je 19,675, to je větší než vypočítaná hodnota. H0 nelze odmítnout. H0 Počty úmrtí dětí při dopravních nehodách jsou v jednotlivých měsících roku stejné.

  12. Nová formulace hypotéz?

  13. Nová formulace H0 Počty úmrtí dětí při dopravních nehodách v období od dubna do října jsou stejně velké jako četnosti úmrtí ve zbývajících měsících roku. HA Počty úmrtí dětí při dopravních nehodách v období od dubna do října jsou větší než četnosti úmrtí ve zbývajících měsících roku.

  14. Co nám vyšlo? H0 Počty úmrtí dětí při dopravních nehodách v období od dubna do října jsou stejně velké jako četnosti úmrtí ve zbývajících měsících roku. HA Počty úmrtí dětí při dopravních nehodách v období od dubna do října jsou větší než četnosti úmrtí ve zbývajících měsících roku. Tabulka četností má 1 stupeň volnosti; kritická hodnota pro hladinu významnosti 0,05 je 3,841. Odmítáme nulovou hypotézu a přijímáme hypotézu alternativní.

  15. Co nám vyšlo? HA Počty úmrtí dětí při dopravních nehodách v období od dubna do října jsou větší než četnosti úmrtí ve zbývajících měsících roku. Tabulka četností má 1 stupeň volnosti; kritická hodnota pro hladinu významnosti 0,05 je 3,841. Odmítáme nulovou hypotézu a přijímáme hypotézu alternativní.

  16. Test nezávislosti chí-kvadrát pro kontingenční tabulku Existuje souvislost mezi dvěma pedagogickými jevy, které byly zachyceny pomocí nominálního (i ordinálního) měření? Časté při zpracování výsledků dotazníkových šetření.

  17. Jak se studuje na koleji? Příklad: Skupině 400 vybraných studentů byl předložen dotazník, ve kterém byly mimo jiné dvě otázky: • Byl(a) jste ubytován(a) na kolejích? A Ano B Ne • Jaký byl Váš průměrný prospěch v loňském studijním roce? • A lepší než 1,6 • B 1,6 – 2,1 • C horší než 2,1 Existuje vztah mezi tím, zda studenti bydlí na kolejích, a tím, jakých studijních výsledků dosahují? H0 Mezi četnostmi odpovědí na obě uvedené otázky není závislost. HA Mezi odpověďmi respondentů na uvedené otázky je závislost. Zvolená hladina významnosti α = 0,05. (Chráska 2007)

  18. Jak se studuje na koleji?

  19. Jak se studuje na koleji?

  20. Jak se studuje na koleji?

  21. Jak se studuje na koleji? χ² = 6,628 Počet stupňů volnosti: počet řádků zmenšený o jednu * počet sloupců zmenšený o jednu = 1 *2 = 2 Kritická hodnota na hladině významnosti 0,05 při dvou stupních volnosti je 5,991. Naše hodnota ji překračuje ► nulovou hypotézu zamítneme. Existuje souvislost mezi bydlením (nebydlením) na kolejích a studijními výsledky studentů.

  22. Kouří více studentů než studentek? Test nezávislostí chí-kvadrát pro čtyřpolní tabulku • zvláštní případ kontingenční tabulky se dvěma řádky a dvěma sloupci. Příklad: Náhodně vybraným vysokoškolským studentům (12 mužů a 36 žen) byla položena otázka, zda kouří. Na základě dat máme rozhodnout, zda studenti kouří častěji než studentky. Výsledky jsou v tabulce.

  23. Kouří více studentů než studentek? H0 Frekvence kouření je u mužů i žen stejně velká. HA Frekvence kouření je u mužů a žen rozdílná. Zvolená hladina významnosti 0,01.

  24. Kouří více studentů než studentek? H0 Frekvence kouření je u mužů i žen stejně velká. HA Frekvence kouření je u mužů a žen rozdílná. Zvolená hladina významnosti 0,01. χ² = 9,063; tabulková hodnota při jednom stupni volnosti na hladině významnosti 0,01 = 6,635. Naměřená hodnota ji překračuje.

  25. Kouří více studentů než studentek? H0 Frekvence kouření je u mužů i žen stejně velká. HA Frekvence kouření je u mužů a žen rozdílná. Zvolená hladina významnosti 0,01. χ² = 9,063; tabulková hodnota při jednom stupni volnosti na hladině významnosti 0,01 = 6,635. Naměřená hodnota ji překračuje. Frekvence kouření u mužů a žen je rozdílná.

  26. Co znamená hladina významnosti? Pro pravděpodobnost chyby 1. druhu (hladinu významnosti) požadujeme, aby nepřekročila předem dané číslo α blízké nule (zpravidla α = 0,05 nebo 0,01). Říkáme, že H0 byla či nebyla zamítnuta na hladině významnosti α. Pokud zvolíme hladinu významnosti 0,05 (jinak zapsáno 5%), pak v 5 případech ze sta zamítáme statistickým testem hypotézu H0, která je platná a zamítnuta být neměla. S pravděpodobností 95% jsme tedy učinili správné rozhodnutí. • V případě, kdy H0 nezamítáme, vyslovíme se o ní neurčitě a řekneme, že nezamítáme H0 na hladině významnosti α. Netvrdíme, že hypotézu H0 přijímáme!!

  27. Stupeň závislosti mezi jevy Pomocí testu chí-kvadrát ►existence závislosti mezi dvěma pedagogickými jevy. K posouzení stupně závislosti mezi jevy existují různé koeficienty: koeficient kontingence C, Čuprův koeficient, atd. Koeficient kontingence C C nabývá hodnot 0 - 1; čím vyšší hodnota, tím vyšší stupeň závislosti. !Ale dva koeficienty nelze srovnávat, pokud tabulky nemají stejný počet řádků a sloupců! Částečně odstraníme výpočtem normovaného koeficientu kontingence.

  28. Stupeň závislosti mezi jevy Příklad: Jak se studuje na koleji? Vypočítaná hodnota χ²= 6,628 Závěr: vztah mezi oběma proměnnými (prospěch, bydlení na koleji) není příliš těsný.

More Related