330 likes | 486 Views
7. přednáška. Základy testování hypotéz. Testování hypotéz. V kvantitativně orientovaných výzkumech ověřujeme hypotézy o vztazích mezi jevy – tzv. věcné hypotézy. Chlapci dosahují lepších výsledků ve fyzice než dívky. Operacionalizujeme - forma statistické hypotézy:
E N D
7. přednáška Základy testování hypotéz
Testování hypotéz V kvantitativně orientovaných výzkumech ověřujeme hypotézy o vztazích mezi jevy – tzv. věcné hypotézy. • Chlapci dosahují lepších výsledků ve fyzice než dívky. Operacionalizujeme - forma statistické hypotézy: • Průměrný počet bodů v didaktickém testu z fyziky je u chlapců vyšší než průměrný počet bodů u dívek. Testování hypotéz - rozhodování • o platnosti nebo neplatnosti hypotézy vyslovené na základě pozorování na výběrovém souboru • předem dané riziko omylu o pravdivosti zkoumané hypotézy
Nulová hypotéza Statistickou hypotézu ověřujeme proti nulové hypotéze. Nulová hypotéza = domněnka, která tvrdí, že mezi proměnnými, které zkoumáme, vztah není. Dokážeme-li, že nulová hypotéza neplatí, přijímáme alternativní hypotézu. H0: Chlapci i dívky budou dosahovat v didaktickém testu z fyziky stejných výsledků.
Co zkoumáme? • Souvisejí spolu dané proměnné (jevy)? Jaké je riziko omylu pro přijetí této hypotézy? • statistické testy významnosti • Jestliže spolu jevy souvisejí, jak těsný je jejich vztah (míra závislosti mezi jevy)? • koeficienty korelace, regrese, kontingence, atd.
Statistické testy významnosti Existuje mezi proměnnými statisticky významný (signifikantní) vztah? (Tj. je velmi nepravděpodobné, že by vztah vznikl náhodou.) Hladina významnosti = pravděpodobnost toho, že jsme neoprávněně odmítli nulovou hypotézu, tedy přijali hypotézu alternativní.
Druhy statistický testů významnosti Týká se nulová hypotéza některého parametru rozdělení náhodné veličiny? • parametrické – vyžadují splnění řady předběžných podmínek, např. rozdělení náhodné veličiny určitého typu (nejčastěji normální) • neparametrické – např. když není znám typ rozdělení náhodné veličiny, jsou univerzálnější, ale mají menší schopnost rozeznat odchylky od nulové hypotézy /a mohou odmítnout nulovou hypotézu jako nesprávnou), vyžadují větší počet případů Jak jsme formulovali alternativní hypotézu? • např. nulová hypotéza typu a = b (a, aritmetický průměr skupiny A = b, aritmetickému průměru skupiny B); • alternativní hypotéza: a > b – jednostranné testy • alternativní hypotéza: a ≠ b – oboustranné testy
Nominální, ordinální, kardinální? Podle proměnných, se kterými pracujeme: • proměnné nominální (několik navzájem se vylučujících hodnot, pracujeme většinou s jejich počty) • proměnné ordinální (jsou nominální proměnné, u nichž hraje roli hierarchické uspořádání) • proměnné kardinální (jsou všechny proměnné, které lze změřit)
Analýza nominálních dat Test dobré shody chí-kvadrát ověřujeme, zda četnosti, které byly získány měřením, se odlišují od teoretických četností, které odpovídají dané nulové hypotéze Test nezávislosti chí-kvadrát pro kontingenční tabulku existuje souvislost mezi dvěma (pedagogickými) jevy, které byly zachyceny pomocí nominálního i ordinálního měření) Test nezávislosti chí-kvadrát pro čtyřpolní tabulku pro případy, že jevy, mezi kterými ověřujeme vztah, mohou nabývat pouze dvou altenativních kvalit Stupeň závislosti mezi jevy při nominálním měření např. koeficient kontingence
Příklad - test dobré shody Chí-kvadrát (χ²) V určitém roce zemřelo v ČR na následky dopravních nehod 114 dětí. Tato úmrtí byla rozdělena do jednotlivých měsíců roku tak, jak uvádí tabulka. Je počet úmrtí ve všech měsících stejný? • H0 Počty úmrtí dětí při dopravních nehodách jsou v jednotlivých měsících roku stejné. • HA Počty úmrtí dětí při dopravních nehodách se v jednotlivých měsících roku liší. Příklad převzat z Chráska, 2007
Postup při testování statistické hypotézy: • Stanovte druh testu • Zformulujte nulovou a alternativní hypotézu • Uveďte testové kritérium a stanovte počet stupňů volnosti - uvést vzorec • Vypočtěte testové kritérium • Nalezněte tabulkové hodnoty • Porovnejte vypočtené testové kritérium s tabulkovou hodnotou • Rozhodněte o nulové hypotéze • Zformulujte závěrečný výrok
Co jsme vypočítali? Vypočítaná hodnota χ2 je 6,000. Ukazuje rozdílmezi pozorovanou a očekávanou četností. Při rozhodování o platnosti nulové hypotézy porovnáváme vypočítanou hodnotu testového kritéria s tzv. kritickou hodnotou. Příslušnou hodnotu hledáme v tabulkách • na zvolené hladině významnosti (pravděpodobnost nesprávného odmítnutí nulové hypotézy) – volíme podle situace • pro určitý počet stupňů volnosti = počet řádků v tabulce, kterým je možné teoreticky přiřknout libovolnou hodnotu (11 stupňů volnosti v našem případě) V tabulkách – kritická hodnota pro hladinu významnosti 0,05 a 11 stupňů volnosti je 19,675, to je větší než vypočítaná hodnota. H0 nelze odmítnout. H0 Počty úmrtí dětí při dopravních nehodách jsou v jednotlivých měsících roku stejné.
Nová formulace H0 Počty úmrtí dětí při dopravních nehodách v období od dubna do října jsou stejně velké jako četnosti úmrtí ve zbývajících měsících roku. HA Počty úmrtí dětí při dopravních nehodách v období od dubna do října jsou větší než četnosti úmrtí ve zbývajících měsících roku.
Co nám vyšlo? H0 Počty úmrtí dětí při dopravních nehodách v období od dubna do října jsou stejně velké jako četnosti úmrtí ve zbývajících měsících roku. HA Počty úmrtí dětí při dopravních nehodách v období od dubna do října jsou větší než četnosti úmrtí ve zbývajících měsících roku. Tabulka četností má 1 stupeň volnosti; kritická hodnota pro hladinu významnosti 0,05 je 3,841. Odmítáme nulovou hypotézu a přijímáme hypotézu alternativní.
Co nám vyšlo? HA Počty úmrtí dětí při dopravních nehodách v období od dubna do října jsou větší než četnosti úmrtí ve zbývajících měsících roku. Tabulka četností má 1 stupeň volnosti; kritická hodnota pro hladinu významnosti 0,05 je 3,841. Odmítáme nulovou hypotézu a přijímáme hypotézu alternativní.
Test nezávislosti chí-kvadrát pro kontingenční tabulku Existuje souvislost mezi dvěma pedagogickými jevy, které byly zachyceny pomocí nominálního (i ordinálního) měření? Časté při zpracování výsledků dotazníkových šetření.
Jak se studuje na koleji? Příklad: Skupině 400 vybraných studentů byl předložen dotazník, ve kterém byly mimo jiné dvě otázky: • Byl(a) jste ubytován(a) na kolejích? A Ano B Ne • Jaký byl Váš průměrný prospěch v loňském studijním roce? • A lepší než 1,6 • B 1,6 – 2,1 • C horší než 2,1 Existuje vztah mezi tím, zda studenti bydlí na kolejích, a tím, jakých studijních výsledků dosahují? H0 Mezi četnostmi odpovědí na obě uvedené otázky není závislost. HA Mezi odpověďmi respondentů na uvedené otázky je závislost. Zvolená hladina významnosti α = 0,05. (Chráska 2007)
Jak se studuje na koleji? χ² = 6,628 Počet stupňů volnosti: počet řádků zmenšený o jednu * počet sloupců zmenšený o jednu = 1 *2 = 2 Kritická hodnota na hladině významnosti 0,05 při dvou stupních volnosti je 5,991. Naše hodnota ji překračuje ► nulovou hypotézu zamítneme. Existuje souvislost mezi bydlením (nebydlením) na kolejích a studijními výsledky studentů.
Kouří více studentů než studentek? Test nezávislostí chí-kvadrát pro čtyřpolní tabulku • zvláštní případ kontingenční tabulky se dvěma řádky a dvěma sloupci. Příklad: Náhodně vybraným vysokoškolským studentům (12 mužů a 36 žen) byla položena otázka, zda kouří. Na základě dat máme rozhodnout, zda studenti kouří častěji než studentky. Výsledky jsou v tabulce.
Kouří více studentů než studentek? H0 Frekvence kouření je u mužů i žen stejně velká. HA Frekvence kouření je u mužů a žen rozdílná. Zvolená hladina významnosti 0,01.
Kouří více studentů než studentek? H0 Frekvence kouření je u mužů i žen stejně velká. HA Frekvence kouření je u mužů a žen rozdílná. Zvolená hladina významnosti 0,01. χ² = 9,063; tabulková hodnota při jednom stupni volnosti na hladině významnosti 0,01 = 6,635. Naměřená hodnota ji překračuje.
Kouří více studentů než studentek? H0 Frekvence kouření je u mužů i žen stejně velká. HA Frekvence kouření je u mužů a žen rozdílná. Zvolená hladina významnosti 0,01. χ² = 9,063; tabulková hodnota při jednom stupni volnosti na hladině významnosti 0,01 = 6,635. Naměřená hodnota ji překračuje. Frekvence kouření u mužů a žen je rozdílná.
Co znamená hladina významnosti? Pro pravděpodobnost chyby 1. druhu (hladinu významnosti) požadujeme, aby nepřekročila předem dané číslo α blízké nule (zpravidla α = 0,05 nebo 0,01). Říkáme, že H0 byla či nebyla zamítnuta na hladině významnosti α. Pokud zvolíme hladinu významnosti 0,05 (jinak zapsáno 5%), pak v 5 případech ze sta zamítáme statistickým testem hypotézu H0, která je platná a zamítnuta být neměla. S pravděpodobností 95% jsme tedy učinili správné rozhodnutí. • V případě, kdy H0 nezamítáme, vyslovíme se o ní neurčitě a řekneme, že nezamítáme H0 na hladině významnosti α. Netvrdíme, že hypotézu H0 přijímáme!!
Stupeň závislosti mezi jevy Pomocí testu chí-kvadrát ►existence závislosti mezi dvěma pedagogickými jevy. K posouzení stupně závislosti mezi jevy existují různé koeficienty: koeficient kontingence C, Čuprův koeficient, atd. Koeficient kontingence C C nabývá hodnot 0 - 1; čím vyšší hodnota, tím vyšší stupeň závislosti. !Ale dva koeficienty nelze srovnávat, pokud tabulky nemají stejný počet řádků a sloupců! Částečně odstraníme výpočtem normovaného koeficientu kontingence.
Stupeň závislosti mezi jevy Příklad: Jak se studuje na koleji? Vypočítaná hodnota χ²= 6,628 Závěr: vztah mezi oběma proměnnými (prospěch, bydlení na koleji) není příliš těsný.