780 likes | 1.11k Views
Statistika. Ing. Jan Popelka, Ph.D . odborný asistent Katedra informatiky a geoinformatiky Univerzita Jana Evangelisty Purkyně v Ústí nad Labem email: jan.popelka @ ujep.cz WWW: http://most. ujep.cz / ~ popelka. Pravděpodobnost. Statistika – 3.hodina. Základní pojmy
E N D
Statistika Ing. Jan Popelka, Ph.D.odborný asistent Katedra informatiky a geoinformatiky Univerzita Jana Evangelisty Purkyně v Ústí nad Labem email: jan.popelka@ujep.cz WWW:http://most.ujep.cz/~popelka
Statistika – 3.hodina • Základní pojmy • Základní pravidla pro počítání s pravděpodobnostmi • Definice pravděpodobnosti • Diskrétní náhodná veličina • Vybraná diskrétní rozdělení • Spojitá náhodná veličina • Vybraná spojitá rozdělení
Pravděpodobnost PRAVDA a PODOBNOST Pravděpodobný = podobný pravdě = podobný skutečnosti = do jaké míry je pravdivý
Pravděpodobnost - jevy Hromadné náhodné jevy (stochastické jevy) • Jsou hromadné – opakují se. • I když probíhají ve stejných podmínkách, nemají stejný průběh. • Výsledek nemůžeme s jistotou předpovědět, lze jen vyjmenovat množinu očekávaných výsledků. • Lze vyčíslit pravděpodobnost, s jakou lze očekávat výsledek z výše uvedené množiny. Biologické jevy, ekonomické jevy, sociální jevy, výskyt poruch. • Chemické, fyzikální, nebo astronomické jevy! ! Příklad: hod kostkou – jeden hod je náhodným pokusem,pokud hod opakuji vícekrát, jde o hromadný jev. Výsledkem je počet ok na kostce (podmínky pokusu musejí být vždy stejné = stejná kostka).
Pravděpodobnost - jevy Hromadné nenáhodné jevy (deterministické jevy) • Mají stejný průběh, pokud probíhají ve stejných podmínkách. • Výsledek jevu můžeme s jistotou předpovědět. • Fyzikální jevy, astronomické jevy, chemické procesy. Příklad: Hod kostkou – hod je deterministickým pokusem,pokud sleduji, zda padne směrem k zemi (podmínky pokusu musejí být vždy stejné). !
Pravděpodobnost - jevy Hromadné náhodné a nenáhodné jevy Rozvoj vědy a lidského myšlení vede k předefinování řady jevů z kategorie náhodných do kategorie nenáhodných. Příklad: Nemoc – dříve mohlo být infekční onemocnění bráno jako náhoda (někdo onemocní a někdo ne), dnes umíme určit podmínky, kdy člověk onemocní a kdy ne (vliv imunitního systému). Příklad: Pohyb planet – dříve byl pohyb planet po obloze považován náhodný, již od starověkých civilizací víme, že se řídí přesnými pravidly. Příklad: Hod kostkou – dnes jej považujeme za ideální příklad náhodného jevu, v budoucnu třeba bude znám přesný model, který předpoví výsledek hodu. ! ! !
Pravděpodobnost - jevy Náhodný (stochastický) jev je výsledkem náhodného pokusu (značí se A, B, C, … ) Hod kostkou je náhodným pokusem a počet ok na kostce je výsledek neboli náhodný jev. • Jednoduché (elementární) jevy – jsou všechny možné výsledky, náhodného pokusu, nelze je rozložit na jevy jednodušší. Příklad: Na kostce padne číslo 2. • Složené jevy – lze je rozložit na jevy jednoduché. Příklad: Na kostce padne číslo sudé. Jev lze rozložit na jednoduché jevy - padne číslo 2, 4 nebo 6. ! !
Pravděpodobnost - jevy Prostor elementárních jevů (E) je množina všech výsledků náhodného pokusu, tedy všech elementárních jevů. Prostor může být konečný, spočetný nebo nespočetný. Příklad: Na šestistěnné kostce jsou elementární jevy hodnoty 1,2,3,4,5,6. Prostor elementárních jevů lze zapsat E = {(1),(2),(3),(4),(5),(6)}. Příklad: Hod dvěma mincemi E={(orel,orel),(panna,panna),(orel,panna), (panna,orel)}. Příklad: Ve Sportce je 13 983 816 elementárních jevů. Pokud vsadíme takovýto počet různých tiketů,vyhrajeme první cenu! ! ! !
Pravděpodobnost - jevy Jistý jev - za daných podmínek nastane vždy. Příklad: Na šestistěnné kostce vždy padne nějaké číslo od 1 do 6. Příklad: Na šestistěnné kostce vždy padne buď číslo sudé nebo číslo liché. Nemožný jev - za daných podmínek nenastane nikdy. Příklad Na šestistěnné kostce nikdy nepadne číslo 0. ! ! !
Pravděpodobnost - operace s jevy Opačný jev (Ā) – je jev, který nastane pouze tehdy, když nenastane jev A. • sjednocení opačných jevů je jistý jev. • opačné jevy jsou jevy neslučitelné (disjunktní) - nemohou nastat zároveň (buď nastane jeden, nebo druhý) Příklad: Při hodu mincí nikdy nepadne panna a orel zároveň. Vždy padne jen jedna možnost. !
Pravděpodobnost - operace s jevy Opačný jev (Ā) – je jev, který nastane pouze tehdy, když nenastane jev A. Pravidla: • sjednocení opačných jevů je jistý jev. • opačné jevy jsou jevy neslučitelné (disjunktní) - nemohou nastat zároveň (buď nastane jeden nebo druhý) Např. Při hodu mincí nikdy nepadne panna a orel zároveň. Vždy padne jen jedna možnost.
Pravděpodobnost - definice Klasická definice (Laplaceova) Příklad: Jaká je pravděpodobnost hlavní výhry ve Sportce? Ve Sportce je 13 983 816 možných případů (možných kombinací šesti čísel ze 49 možných). Hlavní výhra je jen jediná šestice (počet příznivých kombinací šesti čísel je jedna jediná). Pravděpodobnost hlavní výhry je podle klasické definice pravděpodobnosti P(A) = příznivé / možné. P(A) = 1/13 983 816 = 0,000 000072 tj. 0,000 007 2 % !
Pravděpodobnost - definice Klasická definice (Laplaceova) Náhodný pokus má konečný počet n elementárních jevů, které mohou nastat se stejnou možností (n tzv. možných případů). Sledovaný náhodný jev A je určen jako sjednocení určitého počtu (m) z těchto možných el. jevů, tedy jev A nastává při m případech z n možných (m je počet tzv. příznivých případů). Za těchto okolností pravděpodobnost jevu A je rovna: P(A) = m/n
Pravděpodobnost - definice Matematická definice (Kolmogorovova) Pravděpodobnost je definována jako funkce, která přiřazuje náhodnému jevu reálné číslo, a pro toto přiřazení platí tři axiomy: 1. Pravděpodobnost náhodného jevu A je nezáporné číslo: P(A) ≥ 0. 2. Pravděpodobnost jistého jevu E je jedna: P(E) = 1. 3. Pravděpodobnost sjednocení dvou vzájemně neslučitelných (disjunktivních) jevů A a B je rovna součtu jejich pravděpodobností:platí-li , pak .
Pravděpodobnost - definice Statistická definice (vonMisessova) Příklad: Jaká je pravděpodobnost narození holčičky? ! Statistická definice odvozuje pravděpodobnost na základě pokusu. Pokusem mohou být porody na území České republiky za uplynulý rok, kdy se narodilo 61 483 chlapců a 58 359 dívek. Pravděpodobnost narození holčičky je přibližně 58 359 /119 842 = 0,486, tedy 48,69 %. Pro porovnání za rok 2003: 45 554/93 658 = 0,486, tedy 48,64 %. S rostoucím počtem sledovaných náhodných pokusů se zjištěná relativní četnost bude přibližovat odhadované pravděpodobnosti.
Pravděpodobnost - definice Statistická definice (vonMisessova) Provedli jsme n-krát náhodný pokus. V této sérii pokusů nastal náhodný jev A m-krát. Relativní četnost pokusu A (tj. poměr m/n) se přibližuje (konverguje) k pravděpodobnosti tohoto jevu pro velký počet náhodných pokusů:
Pravděpodobnost - definice Statistická definice (vonMisessova) • Pravděpodobnost jistého jevu E je jedna: P(E) = 1. • Pravděpodobnost nemožného jevu Ø je nula: P(Ø) = 0. • Pravděpodobnost libovolného náhodného jevu A je: 0 ≤ P(A) ≤ 1.
Pravděpodobnost - definice ! Statistická definice (vonMisessova) Pravděpodobnost úmrtí v Ústeckém kraji podle věku (2009-2010)
Pravděpodobnost - definice ! Statistická definice (vonMisessova) • Pravděpodobnost smrti úrazem • Pravděpodobnost smrti sebevraždou • Pravděpodobnost smrti vraždou • Pravděpodobnost smrti úrazem, sebevraždou a vraždou (konec 18. století) • Pravděpodobnost smrti úrazem, sebevraždou a vraždou (normalizace) 4 % 1,3 % 0,1 % 1 %, 1%, 0,1 % 5 %, 1,6%, 0,1 %
Náhodná veličina • Náhodná veličina je kvantitativní zobrazení výsledků náhodného pokusu. Náhodná veličina se značí X (velké X) a konkrétní hodnoty, kterých může nabývat xi. počet ok na kostce, počet poruch stroje za rok, počet zákazníků na pokladně za hodinu, počet mrtvých stromů na 1 ha lesa. • Diskrétní náhodná veličina nabývá konečného nebo spočetného počtu hodnot. • Spojitá náhodná veličina nabývá libovolných hodnot z konečného nebo nekonečného intervalu. Výška člověka ve 20 letech, porodní váha, výrobní odchylka, doba životnosti výrobku, cena akcie.
Diskrétní Rozdělení • Diskrétní náhodná veličina nabývá konečného nebo spočetného počtu hodnot.
Diskrétní rozdělení Pravděpodobnost, že náhodná veličina nabyla konkrétní hodnoty xi zapisujeme: P(X = xi) = P(xi) = pi Rozdělení pravděpodobností je vztah mezi hodnotami resp. intervaly náhodné veličiny X a jejichpravděpodobnostmi pi.
Diskrétní rozdělení ! Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet narozených chlapců mezi třemi novorozenci. Pravděpodobnost narození chlapce je 0,52. Popis rozdělení prostřednictvím tabulky:Náhodná veličina X nabývá hodnot 0,1,2,3 (kolik chlapců může být mezi třemi novorozenci).
Pravděpodobnostní Funkce P(x) • Pravděpodobnostní funkce pro nespojitou náhodnou veličinu udává pravděpodobnost, že náhodná veličina X nabude hodnoty x. • P(x) = P(X =x) • Vlastnosti pravděpodobnostní funkce: • funkcejeomezená 0 ≤P(x) ≤ 1 • pravděpodobnostní funkce diskrétní náhodné veličiny je nespojitá!
Pravděpodobnostní Funkce P(x) ! Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet narozených chlapců mezi třemi novorozenci. Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet narozených chlapců mezi třemi novorozenci. Popis rozdělení prostřednictvím grafu pravděpodobnostní fce P(x):
Pravděpodobnostní Funkce P(x) ! Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet narozených chlapců mezi třemi novorozenci. Popis rozdělení funkčním zápisem pravděpodobnostní fce P(x): Pravděpodobnostní funkci příkladu lze obecně zapsat:
Distribuční Funkce F(x) • Distribuční funkce (někdy také kumulativní distribuční funkce) pro nespojitou náhodnou veličinu udává pravděpodobnost, že náhodná veličina X nabude hodnoty menší, než je zvolená hodnota x, nebo stejně velké. • F(x) = P(X≤x) • Vlastnosti distribuční funkce: • 0 ≤F(x) ≤ 1omezená funkce • pro a < b platíF(a) ≤ F(b)neklesající funkce • P(a < X ≤ b) = F(b) - F(a) • distribuční funkce diskrétní náhodné veličiny je nespojitá • F(x) = P(X ≤ x) = ΣP(x)
Distribuční Funkce F(x) ! Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet narozených chlapců mezi třemi novorozenci. Popis rozdělení prostřednictvím tabulky:(bude doplněn sloupec distribuční funkce). Hodnoty F(x) vyjadřují pravděpodobnost, že se narodí xnebo méně chlapců!
Distribuční Funkce F(x) ! Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet narozených chlapců mezi třemi novorozenci. Popis rozdělení prostřednictvím grafu distribuční funkce F(x):
Binomické Bi(n,) Graf pravděpodobnostní funkce P(x) Graf distribuční funkce F(x)
Binomické Bi(n,) Aplikace:Náhodný výběr s vracením prvků.Pravděpodobnost, že se v sérii n nezávislých náhodných pokusů objeví sledovaný jev právě x krát. Např: „hod více kostkami“. Pravděpodobnostní funkce: , x = 0,1,2,...,n, , 0<π<1 Parametry:π ... pravděpodobnost náhodného jevu n ... počet opakování Střední hodnota: Rozptyl: MS Excel = BINOMDIST(počet úspěšných pokusů - x ; celkový počet pokusů- n; pravděpodobnost úspěchu – π ; pravděpodobnostní fce - 0 nebo distribuční funkce - 1)
Binomické Bi(n,) ! Příklad: Jaká je pravděpodobnost, že při hodu pěti kostkami padne třikrát číslo sudé? Parametry:π = 0,5 (pravděpodobnost náhodného jevu – padne sudé číslo)n = 5 (počet opakování – počet hodů), x = 3 (úspěšné pokusy) Výpočet: Střední hodnota: Rozptyl: MS Excel = BINOMDIST(3; 5; 0,5; 0)
Binomické Bi(n,) ! Příklad: Konkrétní student FŽP má pravděpodobnost zaspání na výuku 0,3. 4x v týdnu je výuka od 8:00. Jaká je pravděpodobnost, že zaspí 2x v týdnu? Parametry:π = 0,3 (pravděpodobnost náhodného jevu = zaspí)n = 4 (počet opakování = počet dnů), x = 2 (úspěšné pokusy = zaspání) Výpočet: Střední hodnota: Rozptyl: MS Excel = BINOMDIST(2; 4; 0,3; 0)
Binomické Bi(n,) ! Příklad: Konkrétní student FŽP má pravděpodobnost zaspání na výuku 0,3. 4x v týdnu je výuka od 8:00. Jaká je pravděpodobnost, že zaspí 2x v týdnu? Graf pravděpodobnostní funkce P(x) P(2)= 0,264
Binomické Bi(n,) ! Příklad: Konkrétní student FŽP má pravděpodobnost zaspání na výuku 0,3. 4x v týdnu je výuka od 8:00. Jaká je pravděpodobnost, že zaspí alespoň 1x? Parametry:π = 0,3 (pravděpodobnost náhodného jevu – zaspí)n = 4 (počet opakování – počet dnů), alespoň 1x tzn. x ≥ 1(zaspání) Výpočet: Střední hodnota: Rozptyl: MS Excel = 1-BINOMDIST(0; 4; 0,3; 0)
Poissonovo Po() Graf pravděpodobnostní funkce P(x) Graf distribuční funkce F(x) λ = 10 λ = 4 • λ = 10 • λ = 4
Poissonovo Po() Aplikace: Počet událostí v časové jednotce, počet částic v jednotce plochy nebo objemu. Např: „doba obsluhy“; „chybovost výrobků“. Pravděpodobnostní funkce: , k = 0,1,2,... Parametry:... střední počet událostí v časové jednotce, jednotce plochy nebo objemu Střední hodnota: Rozptyl: MS Excel = POISSON (počet událostí - k ; průměrný počet událostí- ; pravděpodobnostní fce - 0 nebo distribuční funkce - 1)
Poissonovo Po() ! Za hodinu přijede k čerpací stanici 30 automobilů? Jaká je pravděpodobnost, že za 20 minut jich přijede 15? Parametry:= 10 = (30/60)·20(počet aut za 20 minut) Výpočet: Střední hodnota: Rozptyl: MS Excel = POISSON (15; 10; 0)
Poissonovo Po() ! Za hodinu přijede k čerpací stanici 30 automobilů? Jaká je pravděpodobnost, že za 20 minut jich přijede 15? Graf pravděpodobnostní funkce P(x) P(15) = 0,035
HypergeometrickéHy(N,M,n) Aplikace:Náhodný výběr bez vracení prvků (počet prvků výběruse snižuje). Např: „tahání barevných kuliček“; „zjišťování vadných výrobků při přejímce zboží“. Pravděpodobnostní funkce: , max(0,n-N+M) ≤ x ≤ min(M, n) Parametry:N ... počet jednotek v základním souboruM ... počet jednotek se sledovanou vlastnostín ... počet náhodně vybraných jednotek (výběr)
HypergeometrickéHy(N,M,n) Aplikace:Náhodný výběr bez vracení prvků (počet prvků výběruse snižuje). Např: „tahání barevných kuliček“; „zjišťování vadných výrobků při přejímce zboží“. Střední hodnota, rozptyl: MS Excel = HYPGEOMDIST(počet úspěšných pokusů - k ; počet náhodně vybraných jednotek - n; počet jednotek se sledovanou vlastností – M ; počet jednotek v souboru - N)
HypergeometrickéHy(N,M,n) ! Ze 12 studentů se průběžně připravují 4. Jaká je pravděpodobnost, že při dotázání 2 náhodně vybraných studentů, budou oba vědět. Parametry:N= 12 (studentů ve třídě); M = 4 (se připravují); n = 2 (vybraní) Výpočet: Střední hodnota: Rozptyl: MS Excel =HYPGEOMDIST(2;2;4;12)
HypergeometrickéHy(N,M,n) ! Ze 12 studentů se průběžně připravují 4. Jaká je pravděpodobnost, že při dotázání 2 náhodně vybraných studentů, budou oba vědět. Graf pravděpodobnostní funkce P(x) P(2)= 0,091
Charakteristiky Rozdělení Obecný způsob výpočtu střední hodnoty diskrétní náhodné veličiny: Obecný způsob výpočtu rozptylu diskrétní náhodné veličiny:
Spojitá Rozdělení • Spojitá náhodná veličinanabývá libovolných hodnot z konečného nebo nekonečného intervalu.
Distribuční Funkce F(x) • Distribuční funkce (někdy také kumulativní distribuční funkce) pro spojitou náhodnou veličinu udává pravděpodobnost, že náhodná veličina X nabude hodnoty menší, než je zvolená hodnota x, nebo stejně velké: • F(x) = P(X≤x) • Vlastnosti distribuční funkce: • 0 ≤F(x) ≤ 1omezená funkce, • pro a < b platí F(a) ≤ F(b)neklesající funkce, • P (a < X ≤ b) = F(b) - F(a), • distribuční funkce spojité náhodné veličiny je spojitá.
Hustota Pravděpodobnosti f(x) Pravděpodobnostnífunkce pro spojitou náhodnou veličinu neexistuje! Pravděpodobnost, že se trefíme právě do určité hodnoty z nekonečného počtu možných hodnot spojité veličiny, je nulová. Paradox nulové pravděpodobnosti: P(X = x) = 0.
Hustota Pravděpodobnosti f(x) • Kvůli paradoxu nulové pravděpodobnosti je zavedena nová funkce • hustota pravděpodobnosti – f(x). • f(x) ≥ 0 pro všechna x • v oblasti - ∞ a + ∞ se její hodnota blíží nule Příklady hustoty pravď. 0 0 0 0 0 0