250 likes | 403 Views
2. hét. Mintavételes eljárások Becslés. Teljes sokaság vizsgálata. Egy tanulócsoport hallgatóinak ösztöndíjaira vonatkozó adatokat. Jellemezzük a tanulócsoport hallgatóit, mint sokaságot az ösztöndíjuk alapján!. Általános jelölések: sokaság-minta. Mintából való következtetés.
E N D
2. hét Mintavételes eljárások Becslés
Teljes sokaság vizsgálata Egy tanulócsoport hallgatóinak ösztöndíjaira vonatkozó adatokat Jellemezzük a tanulócsoport hallgatóit, mint sokaságot az ösztöndíjuk alapján!
Mintából való következtetés Hipotézisvizsgálat Becslés: A sokaság bizonyos jellemzőinek, paraméterének közelítő megállapításával foglalkozik . Hipotézisvizsgálat: A sokaságra vonatkozó valamely állítás helyességét ellenőrzi. Becslés
Alapfogalmak • Becslőfüggvény : egy olyan statisztika, ami valamely sokasági jellemző mintából történő közelítő meghatározását szolgálja. • Pontbecslés A becslőfüggvény mintából számított konkrét értéke • Intervallumbecslés Adott megbízhatósági szinthez tartozó intervallum alsó és felső határának meghatározása • Sokasági jellemző (paraméter): • Konfidencia-intervallum egy x1, x2, ….xn mintából: Meg kell határoznunk a becslő függvénynek azt a és értékeit, melyekre teljesül, hogy π valószínűséggel közrefogják a sokasági paramétert. • Standard hiba A becslő függvény valamennyi lehetséges mintából számított értékeinek a szórása.
Becslő függvényekkel szemben támasztott követelmények Torzítatlanság: Torzítatlannak nevezzük a becslő függvényt, ha a várható értéke egyenlő a paraméterrel, ellenkező esetben a becslő függvény torzított. A továbbiakban a következők becslő függvényeket fogjuk alkalmazni: • Mintaátlag (a sokasági várható érték torzítatlan becslő függvénye). • A mintabeli relatív gyakoriság (a sokasági megoszlási viszonyszám (valószínűség) torzítatlan becslése). • A korrigált tapasztalati szórásnégyzetet (a sokasági szórásnégyzet torzítatlan becslő függvénye.) Hatásosság: két becslő függvény közül azt tekintjük hatásosabbnak, amelynek kisebb a szórása (standard hibája). Konzisztencia: a mintanagyság növelésével a becslés nagy valószínűséggel a sokasági paraméter felé, a becslő függvény szórása pedig a nulla felé tart. Ezért nagy minta használata esetén elfogadható az olyan konzisztens becslés is, amely nem torzítatlan.
A becslési eljárás lépései • A becslés célja és a sokaságra vonatkozó mintán kívüli információk ismeretében megválasztjuk az alkalmazandó becslő formulát. • Meghatározzuk a mintaátlagot. • Megfelelő módon kiszámítjuk a standard hibát. • Az elvárt megbízhatósági szintnek megfelelően meghatározzuk a megbízhatósági együttható értékét az eloszlástáblázatok segítségével. • Meghatározzuk a konfidencia intervallumot.
Várható érték intervallum becslése Alapesetei: • Normális eloszlású sokaság, melynek szórása ismert. • Normális eloszlású sokaság, melynek szórása nem ismert. Ha a sokaság nem tekinthető normális eloszlásúnak: Ebben az esetben a központi határeloszlás már említett tételére támaszkodva azt mondhatjuk, hogy ha kellően nagy méretű mintát vizsgálunk, akkor a változó közelíti a normális eloszlást. Amennyiben kis minta áll rendelkezésre az elemzéshez, úgy egyéni sajátosságokat figyelembe vevő módszereket kell alkalmaznunk.
1.) sokaság eloszlása normális, ismert a sokasági szórás, mintanagyság tetszőleges 2.) sokaság eloszlása nem ismert, nem ismert a sokasági szórás, nagy minta 3.) sokaság eloszlása normális, nem ismert a sokasági szórás, n < 100
Várható érték intervallum becslése Lépései: • A sokaság a vizsgált változó alapján normális eloszlású, a minta elemszám tetszőleges és a szórását is ismerjük valamilyen korábbi felmérésből. • A várható érték pontbecsléséből kell kiindulnunk. • A mintaátlagot standardizáljuk, azaz a következő képlet alapján transzformáljuk: • Adott π megbízhatósági szint mellett egy normális eloszlású, ismert szórású sokaság várható értékének intervalluma a következő formula segítségével becsülhető:
Mintapélda – várható érték Egy élelmiszer-feldolgozó vállalat adatai (N=50.000): z=2,32 A sokasági szórás ismeretében (σ=15g) a standard hiba
Várható érték intervallum becslése Lépései: • A sokaság a vizsgált változó alapján normális eloszlású, a minta elemszám 100 egyednél nagyobb és a szórását nem ismerjük. • A várható érték pontbecsléséből kell kiindulnunk. • A mintaátlagot standardizáljuk, azaz a következő képlet alapján transzformáljuk: • Adott π megbízhatósági szint mellett egy normális eloszlású, ismeretlen szórású sokaság várható értékének intervalluma a következő formula segítségével becsülhető:
Mintapélda – várható érték Egy élelmiszer-feldolgozó vállalat adatai z=1,96 A mintabeli szórás és a standard hiba meghatározása
Mintapélda – arány Egy élelmiszer-feldolgozó vállalat adatai (N=50.000): Határozzuk meg 95%-os megbízhatóság mellett, hogy a gép áltat megtöltött üvegek közül hány százalék nem haladja meg az 1480 grammot! Mintabeli arány meghatározása: z=1,96 Standard hiba meghatározása: 95%-os megbízhatósággal a 1480 grammnál kisebb súlyú üvegek aránya legalább 12,465 és legfeljebb 20,88%
Szórásnégyzet, szórás becslése Jellemzői: • A szóráspontbecslésére általában a korrigált tapasztalati szórást, mint torzítatlan becslő függvényt használjuk. • A minta normális eloszlású sokaságból származik. • Nincs semmiféle korlátozás a minta nagyságára nézve. • Becslőfüggvény:
Mintapélda – szórás becslése Egy egyetemen dolgozatírás után a hallgatók által elért pontszámok alakulását vizsgáltuk 100 elemű véletlen kiválasztással gyűjtött minta alapján.