280 likes | 453 Views
2. hét. Mintavételes eljárások. Adatszerzési módok típusai. Kontrollált kísérletek. A végtelen sokaságról való informálódás eszköze. Arra ad választ, hogy a kísérlet végzője által megtervezett feltétel együttesek (kezelések) milyen eredményre vezetnek. Reprezentatív megfigyelés.
E N D
2. hét Mintavételes eljárások
Kontrollált kísérletek • A végtelen sokaságról való informálódás eszköze. • Arra ad választ, hogy a kísérlet végzője által megtervezett feltétel együttesek (kezelések) milyen eredményre vezetnek.
Reprezentatív megfigyelés • A legfontosabb adatfelvételi módszer. • A statisztikai következtetéselmélet kiindulópontja. • A mintavételből származó minden eredményt a sokaság egészének jellemzésére használják fel, azaz általánosítanak a teljes sokaságra. • Reprezentatív a minta, ha tükrözi az alapsokaságot, annak jellemzőit, tulajdonságait, összetételét. • Mindig megadható a mintavételi hiba, azaz, hogy a mintavétel tényéből mekkora hiba fakad.
Nem reprezentatív megfigyelés (egyéb részleges megfigyelés) • Nincs benne az általánosításra való törekvés, a következtetések kizárólag megfigyelt egyedekre vonatkoznak.
A statisztikai következtetéselmélet Célja: a részleges megfigyelések eredményeiből következtetés a sokaságra. Területei: • A mintavétel módszertana és gyakorlata. • A becslési eljárás. • Hipotézisvizsgálat. • Több változó kapcsolatának, együttmozgásának vizsgálata.
A mintavétel Célja: a megszerzett adatok alapján megalapozott következtetéseket hozni az alapsokaságra vonatkozóan. Lépései: • A minta és a mintavétel megtervezése, mintaelemek kijelölése. • A kijelölt mintaelemek megfigyelése. • A mintavételi hiba kezelésének megtervezése.
A mintavételi hiba A vizsgált mutató lehetséges mintákból számított értékeinek átlagoseltérését mutatja a megfelelő sokasági értéktől. Típusai: • Nemmintavételi hiba • Mintavételi hiba A mintavételi hiba függ: • A sokaság jellegétől. • Az alkalmazott mintavételi eljárástól. • A vizsgált mutatószám fajtájától. • A minta nagyságától.
I. FAE - független, azonos eloszlású minta Jellemzői: • Homogén, végtelen sokaságból veszünk véletlen, visszatevéses vagy visszatevés nélküli mintát. • Véges sokaságból azonos valószínűséggel veszünk visszatevéses mintát. • Gyakorlati alkalmazása elsősorban a tömegtermelés minőségellenőrzésénél célszerű. Hibája: • A sokasági szórás gyakran ismeretlen. • Sokszor több változó vizsgálata a cél – a mintaelemszám meghatározása problémás.
II. EV - egyszerű véletlen minta • Homogén és véges elemszámú sokaság esetén alkalmazható. • A mintát visszatevés nélkül választjuk ki. • Minden lehetséges n elemű minta kiválasztásának a valószínűsége azonos. • Hasonló a FAE mintához, de véges és kisebb elemszámú sokaságok esetén inkább ez használatos.
EV - egyszerű véletlen minta Előnye: • A visszatevés a gyakorlatban nem mindig, vagy nem teljeskörűen hajtható végre. • Azonos elem ismételt megfigyelése felesleges. Hátránya: • A megfigyelt sokaságok többnyire nem homogének. Lépései: • A komplett lista összeállítása. • A mintanagyság meghatározása. • A minta kiválasztása.
III. R - rétegzett mintavétel Jellemzői: • Heterogén sokaság esetén alkalmazható. • Előzetes információ áll rendelkezésre arra nézve, hogy a sokaságot homogén osztályokba lehet sorolni. Lépései: • Először a fősokaságot valamilyen ismérv szerint átfedés-mentesen homogén rétegekre osztjuk. • Ezután az egyes rétegeken belül egymástól függetlenül EV (ritkábban FAE) mintát veszünk. Előnye: • Azonos mintanagyság esetén a vizsgált jellemzőkre (, ) kisebb hibát kapunk, mint az EV mintavétellel feltéve, hogy a rétegezés jó volt. TÍPUSAI
1. Egyenletes rétegzés Jellemző: • Minden egyes rétegbe azonos számú mintaelem kerül. Előnye: • Egyszerű. • Végrehajtása kényelmes. • Könnyű az egyes rétegeket számszerűen jellemezni. N1≠N2, de n1= n2
2. Arányos rétegzés Jellemző: • A mintába a sokasági arányoknak megfelelően választjuk meg az elemszámot. Előnye: • Ha a rétegenkénti sokasági szórást nem ismerjük, az ebből számított mutatók mintavételi hibája minimális. • A mintából számított főátlag hibája sohasem nagyobb, mint EV mintavételnél. • .
3. Neyman-féle optimális rétegzés Jellemzői: • A szórások alapján osztja a mintát. • Nagyobb rétegekből nagyobb mintát vesz. • A változékonyabb, heterogénebb rétegekből szintén nagyobb mintát vesz. Előnye: • Főátlag becslése során a mintavételi hiba minimális. Hátránya: • σj ritkán ismert.
4. Költség-optimális rétegzés Jellemzői: • Az egyes rétegek szórása mellett ismerjük és a kiválasztásnál figyelembe vesszük az egyes rétegek megfigyelésének költségét is. • Adott költségkeret mellett minimális hibát eredményez. Képlete: ahol πj az egyes rétegek elemeinek megfigyelési egységköltsége.
IV. CS - csoportos (egylépcsős) mintavétel Homogén, véges sokaság esetén használható, ha • nem áll rendelkezésre a sokasági elemek teljes listája, de nagyobb csoportokra rendelkezünk listával. • a csoportok a koncentráltságuk miatt könnyebben, olcsóbban figyelhetők meg, mint az egyedek. Lépései: • Először a csoportok halmazából EV mintát veszünk. • Az így kiválasztott csoportokat teljes körűen megfigyeljük. Előnye: • Egyszerűbb és olcsóbb, mint a FAE vagy az EV minta. Hátránya: • Pontossága függ a csoporton belüli homogenitástól.
V. TL - többlépcsős mintavétel Jellemzői: • Hasonló esetekben használjuk, mint a csoportos mintavételt. • Több lépcsőben jutunk el a végső megfigyelési egységhez. • Leggyakoribb típusa a kétlépcsős mintavétel: • először EV mintavétellel kiválasztjuk a csoportokat, majd • a csoporton belül is EV mintavételt végzünk. Követelmény: • A minta önsúlyozó legyen, azaz megtartsa a sokasági arányokat.
1. Szisztematikus kiválasztás Jellemzői: • ha n elemű mintát akarunk venni egy N elemű sokaságból, akkor meghatározva a k=N/n lépésközt a k0 véletlen kezdőpontból kiindulva minden k-adik elemet figyeljük meg: • A minta gyorsan és mechanikusan kiválasztható. • Egybeeshet az EV megfigyeléssel, ha az elemek felsorolása független a megfigyelés tárgyától.
2. Kvótás kiválasztás Jellemzői: • Rögzítve van, hogy milyen összetételű mintát kell létrehozni. • A „kereteket” véletlen kiválasztással kitöltik. • A rétegzett mintavételhez hasonló eredmény hoz. • Nem szükséges előre rögzíteni a sokasági vagy réteglistákat.
3. Koncentrált kiválasztás Jellemzői: • Erősen koncentrált sokaság esetén alkalmazzák. • Kevés egyed rendelkezik nagy befolyással a sokasági jellemzőre.
4. Hólabda kiválasztás Jellemzői: • Ritka, nehezen számba vehető sokaságok esetén alkalmazzuk. • Néhány kiválasztott egyedből indulunk ki. • Minden egyed a saját „ismeretségi köréből” keresi a következő mintaelemet.
5. Önkényes, szubjektív kiválasztás Jellemzői: • Szubjektív szempontok alapján történik a minta kiválasztása. • Széleskörű ismeretek esetén jó jellemzőkkel rendelkező mintát lehet kapni.
Ismételt vagy másodlagos mintavételi eljárások jellemzői • Speciális csoport a gyakorlatban alkalmazott mintavételi módok között. • Elvi alapja az a felismerés, hogy a tényleges mintavétel igen költséges, míg a számítógép használata egyre olcsóbb! → a meglévő kisebb és olcsóbb mintákat számítógépes módszerekkel megtöbbszörözik. • A meglévő mintából újabb mintákat képeznek azért, hogy a mintában lévő információkat jobban kihasználják.
Ismételt vagy másodlagos mintavételi eljárások típusai 1.) Független részminták módszere 2.) Kiegyensúlyozott ismétlések 3.) Jackknife módszer 4.) Bootstrap módszer