190 likes | 337 Views
Diskrétní rozdělení. Karel Zvára. Populace - výběr. populace : idealizovaná situace, jako bychom znali všechny možné výsledky pokusu i s jejich pstmi, všechny možné prvky populace i s jejich vlastnostmi číselný výsledek pokusu – náhodná veličina
E N D
Diskrétní rozdělení Karel Zvára
Populace - výběr populace: • idealizovaná situace, jako bychom znali všechny možné výsledky pokusu i s jejich pstmi, všechny možné prvky populace i s jejich vlastnostmi • číselný výsledek pokusu – náhodná veličina • n. v. charakterizována populačními parametry náhodný výběr: • vzorek populace, který můžeme měřit ... • charakterizován výběrovými parametry • z náhodného výběru soudíme na populaci
Populace - výběr populační charakteristiky • (populační) průměr, (populační) rozptyl, pravděpodobnost náhodného jevu výběrové charakteristiky • (výběrový) průměr, (výběrový) rozptyl, relativní četnost náhodného jevu testovaná hypotéza – tvrzení o populaci, rozhodujeme na základě náhodného výběru, rozhodnutí je náhodné (náhodný jev)
Náhodná veličina • číselně vyjádřený výsledek náhodného pokusu • rozdělení NV – idealizovaná představa o možných hodnotách NV a frekvenci jejich výskytu • spojité rozdělení (např. normální) – v principu může nabývat všech hodnot z daného rozmezí (intervalu), např. hmotnost, délka, koncentrace . • diskrétní rozdělení – nabývá jen od sebe oddělených hodnot
Diskrétní rozdělení • zpravidla počty případů, kolikrát nastal sledovaný jev – četnosti • popsáno (určeno, definováno): • seznam možných hodnotx1, x2, ... • pravděpodobnosti těchto hodnot P(X = x1), ... • střední hodnota, též populační průměr (protějšek výběrového průměru): vážený průměr možných hodnot
Alternativní rozdělení • též Bernoulliovo (nula-jedničkové) rozdělení: • náhodný pokus se dvěma možnými výsledky • P(zdar)= , P(nezdar) = • Bernoulliův pokus • náhodná veličina X = počet zdarů v pokusu • obecný zápis
Alternativní rozdělení - parametry • (populační) průměr, střední hodnota: • vážený průměr možných hodnot • (populační) rozptyl: • vážený průměr čtverců odchylek od (populačního) průměru • příklad: počet chlapců při jednočetném porodu
Binomické rozdělení • nnezávislých opakování Bernoulliova pokusu • v každém zjišťujeme, zda sledovaný jev nastal či nikoliv • pravděpodobnost p zdaru vždy stejná • X = počet pokusů, kdy jev (zdar) nastal • příklady:počet děvčat v rodině se třemi dětmi, nikoliv např. počet potratů u ženy po třech těhotenstvích
binomické rozdělení Bi(n,): • X lze chápat jako součet n nezávislých veličin s alternativním rozdělením (počty výskytů v jednotlivých pokusech) • (populační) průměr roven nπ , • (populační) rozptyl n π(1- π), • n-násobek charakteristiky alternat. rozdělení • příklad pst, že ve 12 hodech symetrickou kostkou padne šestka přesně dvakrát:
pro velká n lze použít aproximaci normálním rozdělením se stejným průměrem a rozptylem (pokud n dost velké, např. np (1- p) aspoň 9) • příklad pst, že v 60 hodech kostkou padne nejvýš 15krát šestka přesně 0,966, z aproximace normálním rozdělením 0,958
binomické rozdělení: • odhad pravděpodobnosti p pomocí relativní četnosti • přesnost je dána odmocninou z rozptylu • směrodatná (střední) chyba • nahradíme-li neznámý parametr jeho odhadem p, dostaneme 95% interval spolehlivosti
binomické rozdělení: šířka intervalu spol. závisí na p a na n například pro n = 1200 a p=15 % vyjde pro n = 1200/4 = 300 a p = 15 % vyjde
Poissonovo rozdělení: • není dán počet pokusů, v nichž zjišťujeme, zda sledovaný jev (událost) nastal či nikoliv, čekáme na jeho výskyt danou dobu, hledáme jej na dané ploše ... • hustotu (intenzitu) výskytu charakterizuje l (průměrný počet na jednotce plochy, v jednotkovém čase) • pravděpodobnost výskytu je úměrná délce intervalu, velikosti plochy ... • počty událostí v disjunktních intervalech (plochách) jsou nezávislé • pst současného výskytu dvou událostí zanedbatelná • X = počet událostí, kdy jev nastal
Poissonovo rozdělení: • (populační) průměr i rozptyl jsou l (totožné) • lze použít jako aproximaci binomického rozdělení, je-li pravděpodobnost p malá, pak je np téměř stejné jako np (1-p), volí se l= n p • příklad albínů u krys: n=100, p= 0,001 => l = 100 • 0,001 = 0,1
příklad: počty kolonií (72, 69, 63, 59, 59, 53, 51) interval spolehlivosti zde 95% interval prol hrubá normální aproximace (laspoň 100) zde 95% interval prol
multinomické rozdělení: • zobecnění binomického rozdělení • m možných výsledků pokusu (nastává právě jeden z nich), binomické mělo m = 2 • nnezávislých opakování pokusu • p1, …, pm pravděpodobnosti možných výsledků • X1, …, Xmčetnosti možných výsledků • příklady krevní skupiny (počty skupin A, B, AB, 0), hrací kostka (počty jedniček, …, šestek)
multinomické rozdělení: • protože jednotlivé složky mají binomické rozdělení, je (popul.) průměr Xj roven n pj a rozptyl n pj(1 - pj ) • nejpoužívanější vlastnost má asymptoticky rozdělení chí-kvadrát s m-1 stupni volnosti (mělo by být vždy npjaspoň 5) • příklad je hrací kostka symetrická? (15,5,12,8,14,6)
počet alel Se 2 (Se, Se) 1 (Se, se) 0 (se, se) celkem empirické četnosti 159 321 159 639 očekávané četnosti 159,75 319,50 159,75 639 Příklad • počet alel Se v genotypu 639 potomků heterozygotních rodičů H0: pravděpodobnosti genotypů jsou v poměru 1:2:1
léčba nastydli nenastydli celkem C 17 122 139 placebo 31 109 140 celkem 48 231 279 139·48/279=23,9 139·231/279=115,1 140·48/279=24,1 140·231/279=115,9 Příklad (Paulingova studie) • Pauling (1961): vliv kyseliny askorbové na nachlazení (1 g vitaminu resp. placebo) • kdyby na vitaminu nezáleželo (H0), poměr nastydli/nenastydli, tj. 48/231 se zachová v obou skupinách