1 / 19

Diskrétní rozdělení

Diskrétní rozdělení. Karel Zvára. Populace - výběr. populace : idealizovaná situace, jako bychom znali všechny možné výsledky pokusu i s jejich pstmi, všechny možné prvky populace i s jejich vlastnostmi číselný výsledek pokusu – náhodná veličina

Download Presentation

Diskrétní rozdělení

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Diskrétní rozdělení Karel Zvára

  2. Populace - výběr populace: • idealizovaná situace, jako bychom znali všechny možné výsledky pokusu i s jejich pstmi, všechny možné prvky populace i s jejich vlastnostmi • číselný výsledek pokusu – náhodná veličina • n. v. charakterizována populačními parametry náhodný výběr: • vzorek populace, který můžeme měřit ... • charakterizován výběrovými parametry • z náhodného výběru soudíme na populaci

  3. Populace - výběr populační charakteristiky • (populační) průměr, (populační) rozptyl, pravděpodobnost náhodného jevu výběrové charakteristiky • (výběrový) průměr, (výběrový) rozptyl, relativní četnost náhodného jevu testovaná hypotéza – tvrzení o populaci, rozhodujeme na základě náhodného výběru, rozhodnutí je náhodné (náhodný jev)

  4. Náhodná veličina • číselně vyjádřený výsledek náhodného pokusu • rozdělení NV – idealizovaná představa o možných hodnotách NV a frekvenci jejich výskytu • spojité rozdělení (např. normální) – v principu může nabývat všech hodnot z daného rozmezí (intervalu), např. hmotnost, délka, koncentrace . • diskrétní rozdělení – nabývá jen od sebe oddělených hodnot

  5. Diskrétní rozdělení • zpravidla počty případů, kolikrát nastal sledovaný jev – četnosti • popsáno (určeno, definováno): • seznam možných hodnotx1, x2, ... • pravděpodobnosti těchto hodnot P(X = x1), ... • střední hodnota, též populační průměr (protějšek výběrového průměru): vážený průměr možných hodnot

  6. Alternativní rozdělení • též Bernoulliovo (nula-jedničkové) rozdělení: • náhodný pokus se dvěma možnými výsledky • P(zdar)= , P(nezdar) = • Bernoulliův pokus • náhodná veličina X = počet zdarů v pokusu • obecný zápis

  7. Alternativní rozdělení - parametry • (populační) průměr, střední hodnota: • vážený průměr možných hodnot • (populační) rozptyl: • vážený průměr čtverců odchylek od (populačního) průměru • příklad: počet chlapců při jednočetném porodu

  8. Binomické rozdělení • nnezávislých opakování Bernoulliova pokusu • v každém zjišťujeme, zda sledovaný jev nastal či nikoliv • pravděpodobnost p zdaru vždy stejná • X = počet pokusů, kdy jev (zdar) nastal • příklady:počet děvčat v rodině se třemi dětmi, nikoliv např. počet potratů u ženy po třech těhotenstvích

  9. binomické rozdělení Bi(n,): • X lze chápat jako součet n nezávislých veličin s alternativním rozdělením (počty výskytů v jednotlivých pokusech) • (populační) průměr roven nπ , • (populační) rozptyl n π(1- π), • n-násobek charakteristiky alternat. rozdělení • příklad pst, že ve 12 hodech symetrickou kostkou padne šestka přesně dvakrát:

  10. pro velká n lze použít aproximaci normálním rozdělením se stejným průměrem a rozptylem (pokud n dost velké, např. np (1- p) aspoň 9) • příklad pst, že v 60 hodech kostkou padne nejvýš 15krát šestka přesně 0,966, z aproximace normálním rozdělením 0,958

  11. binomické rozdělení: • odhad pravděpodobnosti p pomocí relativní četnosti • přesnost je dána odmocninou z rozptylu • směrodatná (střední) chyba • nahradíme-li neznámý parametr  jeho odhadem p, dostaneme 95% interval spolehlivosti

  12. binomické rozdělení: šířka intervalu spol. závisí na p a na n například pro n = 1200 a p=15 % vyjde pro n = 1200/4 = 300 a p = 15 % vyjde

  13. Poissonovo rozdělení: • není dán počet pokusů, v nichž zjišťujeme, zda sledovaný jev (událost) nastal či nikoliv, čekáme na jeho výskyt danou dobu, hledáme jej na dané ploše ... • hustotu (intenzitu) výskytu charakterizuje l (průměrný počet na jednotce plochy, v jednotkovém čase) • pravděpodobnost výskytu je úměrná délce intervalu, velikosti plochy ... • počty událostí v disjunktních intervalech (plochách) jsou nezávislé • pst současného výskytu dvou událostí zanedbatelná • X = počet událostí, kdy jev nastal

  14. Poissonovo rozdělení: • (populační) průměr i rozptyl jsou l (totožné) • lze použít jako aproximaci binomického rozdělení, je-li pravděpodobnost p malá, pak je np téměř stejné jako np (1-p), volí se l= n p • příklad albínů u krys: n=100, p= 0,001 => l = 100 • 0,001 = 0,1

  15. příklad: počty kolonií (72, 69, 63, 59, 59, 53, 51) interval spolehlivosti zde 95% interval prol hrubá normální aproximace (laspoň 100) zde 95% interval prol

  16. multinomické rozdělení: • zobecnění binomického rozdělení • m možných výsledků pokusu (nastává právě jeden z nich), binomické mělo m = 2 • nnezávislých opakování pokusu • p1, …, pm pravděpodobnosti možných výsledků • X1, …, Xmčetnosti možných výsledků • příklady krevní skupiny (počty skupin A, B, AB, 0), hrací kostka (počty jedniček, …, šestek)

  17. multinomické rozdělení: • protože jednotlivé složky mají binomické rozdělení, je (popul.) průměr Xj roven n pj a rozptyl n pj(1 - pj ) • nejpoužívanější vlastnost má asymptoticky rozdělení chí-kvadrát s m-1 stupni volnosti (mělo by být vždy npjaspoň 5) • příklad je hrací kostka symetrická? (15,5,12,8,14,6)

  18. počet alel Se 2 (Se, Se) 1 (Se, se) 0 (se, se) celkem empirické četnosti 159 321 159 639 očekávané četnosti 159,75 319,50 159,75 639 Příklad • počet alel Se v genotypu 639 potomků heterozygotních rodičů H0: pravděpodobnosti genotypů jsou v poměru 1:2:1

  19. léčba nastydli nenastydli celkem C 17 122 139 placebo 31 109 140 celkem 48 231 279 139·48/279=23,9 139·231/279=115,1 140·48/279=24,1 140·231/279=115,9 Příklad (Paulingova studie) • Pauling (1961): vliv kyseliny askorbové na nachlazení (1 g vitaminu resp. placebo) • kdyby na vitaminu nezáleželo (H0), poměr nastydli/nenastydli, tj. 48/231 se zachová v obou skupinách

More Related