340 likes | 693 Views
KÖVETKEZTETŐ STATISZTIKA. MINTAVÉTEL. BECSLÉS A sokasági átlag becslése. 2010 tavasz Utoljára módosítva: 2010.02.17. A becslés alapfeladata. Pl. Hányan láttak egy TV műsort?. Jellemzően kétféle választ lehet adni:.
E N D
KÖVETKEZTETŐ STATISZTIKA MINTAVÉTEL BECSLÉS A sokasági átlag becslése 2010 tavasz Utoljára módosítva: 2010.02.17
A becslés alapfeladata Pl. Hányan láttak egy TV műsort? Jellemzően kétféle választ lehet adni: Intervallumbecslés: „A nézettségi arány 95% valószínűséggel 29 és 35 % közé esik.” Pontbecslés Pl. „A minta alapján a sokasági nézettségi arány 32 %”. Vesznek egy mintát, azaz, megkérdeznek 1300 embert, és ebből következtetnek, hogy a teljes sokaság hányadrésze látta a műsort.
Sokaság és minta A mintavétel módja lehet: véletlen és nem véletlen • A véletlen kiválasztás. Ismerjük a sokaság elemeinek mintába kerülési valószínűségét. A vél. minta fontos jellemzője: a reprezentativitás. • Egyszerű véletlen mintavétel • Visszatevéssel • Visszatevés nélkül • Rétegzett minta • Csoportos és többlépcsős minta
A nem-véletlen kiválasztás • Szisztematikus mintavétel (PL. a kijáratnál minden 10-ik vevő megkérdezése) • Kvóta szerinti minta • Koncentrált minta • Önkényes minta
A mintaátlag eloszlása Alapkérdések: A mintaátlag szórása és a sokasági szórás közötti összefüggés Tekinthető-e, ill. mikor tekinthető a mintaátlag eloszlása normális eloszlásúnak? A mintaátlag várható értéke és a sokasági átlag közötti összefüggés
A mintaátlag eloszlása • A mintaátlag valószínűségi változó (mintáról mintára változik), amelynek van • eloszlása, • várható értéke, • szórása. • A mintaátlag normális eloszlású, • Ha a sokaság normális eloszlású • Vagy: ha a minta elég nagy. (n > 30; pl. 100 elem) • Ha • a sokaságeloszlása nem ismert • és a minta kicsi (30 elem alatti), akkor a mintaátlag eloszlása sem ismert. (Ekkor további megfontolásokra van szükség.)
A mintaátlag eloszlásának paraméterei Ha a minta véletlen (a sokaság eloszlásától függetlenül, akár visszatevéses a mintavétel akár nem) akkor, • (A mintaátlag várható értéke a sokasági átlag) • A mintaátlagok szórása, (standard hiba) • Visszatevéses mintánál: • Visszatevés nélküli mintánál: Ahol n / N a kiválasztási arány
PÉLDA sokaság és a minta közötti összefüggésre Vegyünk egy 5 elemű sokaságot. A sokaság elemei legyenek: (2, 3, 4, 5, 6). N =5 • Írjuk össze az összes lehetséges 2 elemű mintát! n = 2 (minden húzás után visszatesszük a kihúzott elemet.) • Ellenőrizzük, hogy • A mintaátlagok várható értéke (átlaga) megyegyezik a sokasági átlaggal! • A mintaátlag varianciája a sokasági variancia n-ed része! • Végezzük el visszatevés nélküli mintára is! Hogyan módosul ekkor a mintátlag varianciája?
A sokasági átlag: A sokasági szórásnégyzet ill. szórás: A mintaátlagok átlaga: A mintaátlagok szórásnégyzete: Következtetés: Megoldás 1. (Visszatevéses minta esetén)
A sokasági átlag: 4 A sokasági szórásnégyzet: 2 ill. szórás: A mintaátlagok átlaga: 4 A mintaátlagok szórásnégyzete = Következtetés: Megoldás 2. (Visszatevés nélküli minta esetén)
A becslő-fv és a jó becslés kritériumai A becslő fv fogalma: A sokasági paraméter becslésére szolgáló, a mintaelemek értékétől függő függvény. pl. a mintaátlag egy becslőfv, mert értéke a mintaelemek értékétől függ, és ezzel becsüljük a sokasági átlagot. A jó becslés kritériumai • Torzítatlanság • Hatásosság • Konzisztencia
Torzítatlan becslések • A mintaátlag a sokasági átlag torzítatlan becslése • mintabeli arány a sokasági aránynak torzítatlan becslése Vagy: • A minta szórása a sokasági szórás torzított becslése. A minta korrigált szórása már torzítatlan
A jó becslés kritériumai (folyt) • Hatásosság: a becslőfüggvény szórása. Minél kisebb a szórása, annál hatásosabb • Konzisztencia (az a tulajdonság, hogy egyre nagyobb mintát véve egyre pontosabb becslést kapunk)
BECSLÉS A sokasági várható érték intervallum-becslése • A sokasági várható értéket a mintaközéppel becsüljük. Ez így egy torzítatlanpontbecslés, - amely nem fog pontosan egybeesni a sokaság tényleges várható értékével. • Meg tudunk azonban adni egy intervallumot, amelybe a sokasági várható érték egy előre adott (pl. 95%-os) valószínűséggel beleesik.
A sokasági átlag intervallumbecslése 95 %-os megbízhatósági szint mellett Ismerjük a mintaátlag eloszlását, és szórását.Tudjuk, hogy Kérdés: mekkora az az intervallum, amelybe a véletlen minta átlaga, ill. annak standardje 95 % valószínűséggel esik? Átrendezve: Rövidebb formában: Tehát 95 % a valószínűsége annak, hogy a sokasági a mintaátlag 1,96 szórásnyi környezetében található.
Az intervallumbecslés általános gondolatmenete Annak a valószínűsége, hogy Átrendezve Tömörebben:
Kifejezések Az (1-a) valószínűség a megbízhatósági szint, vagy konfidencia-szint Az (1-a) valószínűséghez tartozó intervallum a megbízhatósági intervallum vagy konfidencia-intervallum A szorzat a maximális hibavagyhibahatár.
PÉLDA - Átlagbecslési alapfeladat A főiskolások sokaságából 100 fős, azonos eloszlású véletlen mintát vettünk. A mintaátlag 178 cm-nek adódott. A sokaságról tudjuk, hogy normál eloszlású, 15 cm-es szórással, nem ismerjük viszont a sokasági átlagot. • Adjon becslést a sokasági átlagra 95%-os megbízhatósági szinten! • Hogyan változna az eredmény, ha a megbízhatósági szint csak 90%-os lenne?
További figyelembeveendő problémák • Ha nem független a mintavétel. • Ha nem ismerjük a sokasági szórást,
A nem független mintavétel esete A standard hiba kisebb lesz, ahol az n /N a kiválasztási arány.
PéldaBecslés – nem független mintavétellel • Becsülje meg a cég dolgozóinak átlagbérét, ha a megbízhatósági szint 95%! • Hogyan változna az eredmény, ha a vizsgált cég dolgozóinak száma 20 000 fő lenne, de az egyéb adatok változatlanok maradnának? Egy 200 fős cég dolgozóiból egyszerű véletlen mintavétellel kiválasztottunk 100 főt, hogy megbecsülhessük a dolgozók átlagbérét. A mintaátlag 82 eFt. A sokaságról tudjuk, hogy normál eloszlású 15 eFt szórással Megoldás
Ha a sokasági szórás nem ismert • Ha nem ismerjük a sokasági szórást, • akkor a mintából becsüljük. A korrigált mintaszórással számolunk: • és (n -1) szabadságfokú t-eloszlással
A Student (t) eloszlás használata Mikor? Ha az alapsokaság szórása, nem ismert. • kis minta (n<30) esetén kötelező, • nagy minta (n>30; az n=100 már nagy minta!) esetén a standard normális eloszlás z- je is használható Miért? mert a mintátlag standardje nem a standard normál eloszlást követi, hanem a nagyobb szórású t-eloszlást. A mintából becsült szórás használata esetén a becslés bizonytalanabb.
A Student (t) eloszlás ábrája különböző mintanagyságok mellett
PÉLDA (Becslés, – a sokasági szórás nem ismert) Egy 5 ezer fős egyetemen 9 fős egyszerű véletlen minta alapján szeretnénk becslést adni a matematika vizsgára fordított tanulási időre. A normáleloszlás feltételezhető. A mintaátlag 16 óra. A minta korrigált szórása 4 óra. • Adjunk becslést az egyetemi készülési átlagra 95%-os megbízhatósági szint mellett! • Hogyan változna az eredmény, ha 100 fős mintára vonatkozna a fenti átlag és korrigált szórás?
Értékösszeg-becslés esetén Megszorozzuk N-nel • a mintából becsült átlagot • és a D maximális hibát (hibahatárt) Egyébként minden ugyanúgy megy, mint az átlag-becslésnél.
PÉLDA (Értékösszeg becslése) Egy főiskola 5 000 hallgatójának éves színházjegy-vásárlásait vizsgálták mintavételes felméréssel. A sokaság normál eloszlása feltételezhető. A 100 fős mintában az éves összes vásárlási érték 97 000 Ft volt. Az átlagtól való eltérés a mintában átlagosan 680 ft. • Mennyi a mintaátlag standard hibája? • Becsülje meg 95%-os valószínűséggel, hogy mennyi az egy hallgatóra jutó színházjegy vásárlás értéke a vizsgált főiskolán! • Mennyi a főiskolások által szinházjegyre költött teljes összeg maximális értéke? (A megbízhatósági szint továbbra is 95%)
Az átlagbecslés lépései (Áttekintés) 1. A becslőfv az 2. A becslőfv eloszlása: normális vagy Student t? • Ismert-e a sokasági szórás? • Ha nem: a minta nagy vagy kicsi? 3. A standard hiba kiszámítása • Ha a minta visszatevés nélküli, 0,05 alatt van-e az (n/N) arány? • Független-e (visszatevéses-e) a minta? 4. A konf. intervallum kiszámítása Adott konfidenciaszinthez tartozó z vagy t meghatározása (táblázatból v. szám.géppel) 5. Az eredmény értelmezése
Minta-nagyság meghatározásaEV mintánál • Visszatevéses eset: • Visszatevés nélküli eset:
PÉLDA (Folyt) Értékösszeg becslése, mintanagyság meghatározása Egy főiskola 5 000 hallgatójának éves színházjegy-vásárlásait vizsgálták mintavételes felméréssel. A sokaság normál eloszlása feltételezhető. A 100 fős mintában az éves összes vásárlási érték 97 000 Ft volt. Az átlagtól való eltérés a mintában átlagosan 680 Ft. KÉRDÉS: Ha az - átlagra vonatkozó – becslés hibahatárát 80 forint alá szeretnénk szorítani, mekkora mintára lenne szükségünk?
HIVATK. • Ez itt egy hivatkozás a 22-ik diához Vissza