280 likes | 497 Views
Test dobré shody. 2 test. 2 test. testuje shodu očekávaných a pozorovaných četností H 0 : pozorované četnosti = očekávané četnosti Pokud zamítnu H 0 , mohu říct, že pozorované četnosti se od očekávaných liší (a je na mně, abych vysvětlil proč). Příklad.
E N D
Test dobré shody 2 test
2 test • testuje shodu očekávaných a pozorovaných četností • H0: pozorované četnosti = očekávané četnosti • Pokud zamítnu H0, mohu říct, že pozorované četnosti se od očekávaných liší (a je na mně, abych vysvětlil proč)
Příklad • chci zjistit, jestli sexuální index (poměr samců a samic) odpovídá očekávanému (1:1) • chci zjistit, jestli pasti s různým světlem polapily stejný počet jedinců (očekávám 1:1:1…..) • poměr genotypů (očekávám aa : Aa : AA = 1:2:1) • odpovídá poměr maturantů z daného předmětu (chlapci:dívky) poměru pohlaví na škole?
Výpočet Pearson 2 • Kde pi = pozorovaná četnost i-té kategorie, oi = očekávaná četnost i-té kategorie • Musím umět spočítat, protože Excel standardně vyhodí rovnou p
Statistics to use • http://www.physics.csbsju.edu/stats/ • na této adrese lze 2 spočítat
často spočítá 2 , ale napíše že p = 0.000 • p se z principu nemůže rovnat 0! • potom lze v Excelu využít funkci CHIDIST – po zadání hodnoty 2 a d.f. spočítá odpovídající p
Příklad • Chytal jsem juvenilní jedince: 127 samců a 133 samic. Později v sezóně jsem chytil 73 samců a 121 samic. Liší se sexuální indexy v různých datech od očekávaného poměru (1:1)?
Příklad • Chytil jsem tedy 127 samců a 133 samic, celkem 260. Očekávané četnosti jsou tedy 130:130 (poměr 1:1)
Příklad • Měl jsem 2 kategorie, stupně volnosti jsou tedy 2-1 = 1. Při s.v. = 1 je kritická hodnota na hladině 5% 2 = 3,84. Můj výsledek 0,1385 < 3,84, nemohu tedy zamítnout hypotézu H0 (poměr juvenilních samic a samců se významně neliší od očekávaného poměru 1:1) • Excel (fce CHITEST) vyhodí rovnou p, pokud je menší než 0,05 zamítám H0, jinak zamítnout nemůžu (zde p = 0,7098)
Statistické tabulky (kritické hodnoty různých rozdělení) např. na http://new.euromise.org/czech/tajne/ucebnice/html/html/node15.html, nebo na http://home.zcu.cz/~friesl/Archiv/PsaTab.pdf
Příklad • Později jsem tedy chytil 73 samců a 121 samic, celkem 194. Očekávané četnosti jsou tedy 97:97 (poměr 1:1)
Příklad • Můj výsledek 11,876 > 3,84, mohu tedy zamítnout hypotézu H0 (poměr starších samic a samců se tedy významně liší od očekávaného poměru 1:1) • Excel (fce CHITEST) vyhodí rovnou p, pokud je menší než 0,05 zamítám H0, jinak zamítnout nemůžu (zde p = 0,00057)
Příklad • Výsledek: Zatímco poměr pohlaví juvenilních jedinců (127:133) se významně neliší od očekávaného poměru 1:1 (2 = 0.1385, s.v. = 1, p = 0.7098), poměr starších jedinců (73:121) se od očekávaného poměru 1:1 liší signifikantně (2 = 11.876, s.v. = 1, p = 0.00057). • Diskuse: Samci mají vyšší mortalitu… (anebo jsou chytřejší a nedají se tak snadno chytit)….
Pro rozumné použití je nutné, aby četnost většiny kategorií (alespoň 80%) byla nejméně 5, a aby všechny četnosti byly větší než 1 • Když mám malé četnosti, mohu použít Yatesovu korekci (slabší test)
Pokud je shoda s očekávanými četnostmi příliš velká – too good to be true (při náhodnosti dat je nízká pravděpodobnost nejen malé, ale i velké shody!!!) – např. Mendelovy pokusy
Příklad: • Ve třídě (28 žáků) je dlouhodobý poměr přítomných a nepřítomných žáků 13:1. Při písemce chybí 6 žáků. Liší se tato absence statisticky významně od očekávané „průměrné“ absence?
Příklad • do rybníku jsem dal past se světlem bílým, žlutým, modrým, zeleným, červeným • pokud barva světla nemá vliv na počet chycených jedinců, bude poměr cca 1:1:1:1:1 • chytil jsem 56:72:41:53:38 • Má barva světla vliv na odchyt?
Příklad • Pokuste se vymyslet příklad na test dobré shody, který by se dal použít ve vaší DP
Kontingenční tabulky • Obecně – dvě (nebo více) kategoriálních proměnných
Výpočet 2 • r je počet řádků, s je počet sloupců • Očekávané četnosti vypočítám podle celkových součtů a H0 • H0: faktory jsou na sobě nezávislé • s.v. = (r-1)x(s-1)
Příklad • Žáci si mohli vybrat ze 4 předmětů svůj nejoblíbenější • Je oblíbený předmět závislý na pohlaví? • Data viz soubor chi_data.xls
Příklad • Při dlouhém dni se vyvinulo 46 dlouhokřídlých a 12 krátkokřídlých bruslařek, při krátkém dni 32 dlouhokřídlých a 28 krátkokřídlých. • Je frekvence křídelních morf závislá na délce dne?