180 likes | 333 Views
Odhady parametrů základního souboru. Základní soubor (populace) v s. Výběrový soubor. Parametry základního souboru (populace ) = konstantní hodnoty. X. Výběrové charakteristiky = náhodné veličiny
E N D
Základní soubor (populace) vs. Výběrový soubor
Parametry základního souboru (populace) = konstantní hodnoty X Výběrové charakteristiky = náhodné veličiny (na základě různosti jednotlivých výběrů nelze hodnoty výběrových charakteristik určit předem)
Náhodná veličina • Proměnná nabývající různých reálných čísel v závislosti na náhodě • Výsledek náhodného pokusu vyjádřený reálným číslem • NV - spojitá - diskrétní • NV má svoje rozdělení pravděpodobnosti = výběrová rozdělení známe-li výběrové rozdělení, dokážeme odhadnout parametr základního souboru
Rozdělení náhodné veličiny Empirické - hodnoty sledované veličiny Teoretické - matematický model Umíme-li pro každé reálné x určit pravděpodobnost, že náhodná veličina Xnabyde hodnoty menší nebo rovné x, pak známe tzv. rozdělení pravděpodobnosti náhodné veličiny X (= známe hodnoty všech kvantilů).
Odhady parametrů • Bodový odhad - číselná hodnota prezentující hledaný parametr • Intervalový odhad - číselný interval, který s předem danou spolehlivostí vymezí prostor obsahující hledaný parametr
Odhady parametrů • Bodový odhad – parametr zákl. souboru aproximujeme jediným číslem (např. výběrový průměr je bodovým odhadem střední hodnoty μ) • Neposkytuje informaci o kvalitě tohoto odhadu, neříká k jakému největšímu rozdílu mezi odhadem a skutečnou hodnotou parametru může dojít • Používá se, když potřebujeme hledaný parametr vyjádřit jedinou hodnotou, např. když jej budeme používat v dalších výpočtech
Odhady parametrů • Intervalový odhad – parametr zákl. souboru aproximujeme intervalem, v němž daný parametr leží s předem zvolenou pravděpodobností = odhad vyjádříme pomocí dvou čísel (dolní a horní mez intervalu), mezi nimiž se pohybuje skutečná hodnota hledaného parametru s předem zvolenou pravěpodobností • 100(1-α)%-ní interval spolehlivosti = konfidenční interval • Číslo 1- α = koeficient spolehlivosti = spolehlivost odhadu • Číslo α = hladina významnosti (nejčastěji α=0,05 či α=0,01) • Čím ↑ spolehlivost odhadu, tím širší interval spolehlivosti bude a tím ↓ bude jeho vypovídací schopnost (např. 100% interval spolehlivosti průměrného věku všech lidí na Zemi)
Základní pojmy z terorie odhadu • interval spolehlivosti (konfidenční interval) • spolehlivost odhadu (1-α) • hladina významnosti α • odhad parametru θ • bodový odhad parametru θ
Typy intervalových odhadů • Jednostranné • Levostranné , • Pravostranné , • Dvoustranné ,
Graf. prezentace intervalového odhadu Nechť interval spolehlivosti obsahuje hledaný parametr s 95%-ní spolehlivostí – připouštíme 5%-ní chybu odhadu (α=0,05) Dvoustranný interval Jednostranný interval (prav.) f(θ) 5% 2,5% 2,5% θ
známe Intervalové odhady pro střední hodnotu Známe rozptyl Volba vhodné testové statistiky: Levostranný interval spolehlivosti:
známe Intervalové odhady pro střední hodnotu Známe rozptyl Volba vhodné testové statistiky: Pravostranný interval spolehlivosti:
Intervalové odhady pro střední hodnotu Známe rozptyl Volba vhodné testové statistiky: Dvoustranný interval spolehlivosti:
neznáme Intervalové odhady pro střední hodnotu Neznáme rozptyl Volba vhodné testové statistiky: Levostranný interval spolehlivosti: Pravostranný interval spolehlivosti: Dvoustranný interval spolehlivosti:
Přípustná chyba odhadu Δ • hodnota, o kterou jsme ochotni se zmýlit oproti skutečné hodnotě odhadovaného parametru při dané spolehlivosti odhadu (hladině významnosti) • je rovna polovině šířky oboustranného intervalu spolehlivosti
Známe rozptyl Rozsah výběru při odhadu střední hodnoty Oboustranný intervalový odhad : Příslušný intervalový odhad tedy můžeme vyjádřit ve tvaru: Přípustná chyba odhadu Δ : Požadujeme:
Neznáme rozptyl Rozsah výběru při odhadu střední hodnoty Přípustná chyba odhadu: PŘEDVÝBĚR