1 / 14

Matematikai alapok é s val ószínűségszámítás

Matematikai alapok é s val ószínűségszámítás. Statis ztikai becslés Statisztikák eloszlása. Mintavétel. A statisztikában a cél, hogy az érdeklõdés tárgyát képezõ populáció bizonyos paramétereit a populációból vett minta segítségével becsüljük.

karlyn
Download Presentation

Matematikai alapok é s val ószínűségszámítás

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Matematikai alapok és valószínűségszámítás Statisztikai becslés Statisztikák eloszlása

  2. Mintavétel A statisztikában a cél, hogy az érdeklõdés tárgyátképezõ populáció bizonyos paramétereit a populációból vett mintasegítségével becsüljük. A minta akkor jó, ha reprezentatív apopulációra nézve, amit a legjobban akkor biztosíthatunk, havéletlen, vagy más szóval random mintát veszünk, ami azt jelenti,hogy a populáció minden egyes tagjának azonos esélye van a mintábakerülésre.

  3. Bevezetés Példa: Tegyük fel, hogy egy adott populációt az első éves pszichológiaszakos hallgatók képezik. Egy 10 elemű mintát veszünk ebből apopulációból a következõképpen: a neveket felírjuk egy-egy papírra,egy dobozból húzunk 10 nevet. Ebben az esetben a mintavételvéletlen lesz: minden egyes nevet azonos valószínûséggel húzunkki. Az egyes események (húzások), egymástól függetlenek.

  4. Mintavétel Példa: Tegyük fel, hogy egy adott populációt a telefonkönyvben szereplõszemélyek alkotnak. Ebbõl a populációból szeretnénk egy mintátvenni oly módon, hogy véletlenszerûen kiválasztunk egy személyt,majd aztán szisztematikusan haladva minden 100. személy választjukki a mintába kerülésre. Véletlenszerû-e a mintavétel ebben azesetben?

  5. Mintavétel A véletlen mintavétel nagyon fontos lépés a mintareprezentativitásának biztosítására, DE: A véletlen mintavétel nem mindíg garantálja, hogy a minta valóbanreprezentatív lesz a populációra nézve. Pl.: nõk:férfiak arányaegy populációban 43:57, de ha 100 fõs mintát veszünk, lehet, hogya mintabeli arány 38:62 lesz, akkor is, ha a mintavételvéletlenszerû volt. Ilyenkor alkalmazzák a rétegzettmintavételt, azaz, egy változó mentén felosztják a mintát, jelenesetben pl. véletlenszerûen választanak 43 nőt és véletlenszerűenválasztanak 57 férfit, akik a 100 fős mintát alkotják.

  6. Statisztikai becslés A véletlen mintavétel segítségével tehát elérhetõ,hogy a minta a lehetõ legreprezentatívabb legyen a populációranézve. A mintavétel azonban nem cél, csak eszköz, ahhoz, hogy a mintaalapján becsülni tudjuk a populáció különbözõ paramétereit, amikreaz érdeklõdésünk irányul.

  7. Statisztikai becslés A megfelelő módon kiválasztott mintában kiszámolhatjukaz érdeklõdésünk tárgyát képezõ paraméter értéket, amit amintabeli, vagy tapasztalati értéknek nevezünk, és ez atapasztalati érték lesz a populációbeli, vagy elméleti értékbecslése. Ezeket a minta adataiból számolt értékeket statisztikának nevezzük. A becsült érték a gyakorlatban szinte sohasem fog pontosanmegegyezni az általa becsült populációbeli értékkel, hanemvalamennyire szinte mindíg eltér attól. Egy adott populációbeliparaméter és a mintabeli paraméter különbsége a becslés hibája. Abecslés akkor jó, ha torzítatlan, azaz egyik irányba sem elfogult,azaz a becslés uo. valószínûséggel lesz kisebb, mint nagyobb, minta becsülendő paraméter. Azt mondhatjuk tehát, hogy a becslésekvárható értéke (ha valós populációról van szó a becslések átlaga)megegyezik a paraméter elméleti értékével.

  8. Statisztikák elméleti eloszlása Láttuk tehát, hogy a populáció paramétereit a mintábólszámított statisztikával becsülhetjük, például a populáció átlagáta mintaból számolt átlaggal. Azt is láttuk, hogy ez a becslés nagyvalószínûséggel nem fog megegyezni a populációbeli értékkel, hanemhibával terhelt lesz. Ha a populációból egy másik mintát veszünk,abban is kiszámolhatjuk az adott statisztika (becslés) értékét,ami vélhetõleg szintén nem egyezik majd pontosan a becsülendõpopulációparaméterrel, de így már 2 becslésünk lesz a populációparaméterre. Ezek átlagát vehetjük, és azt is tekinthetjük amegfelelõ elméleti paraméter becslésének. Aztán vehetünk még egymintát, ebben is számolhatjuk a megfelelõ statisztikát, és ígytovább.

  9. Statisztikák elméleti eloszlása Ily módon tehát vehetjük egy adott populáció összes nelemû mintáját és mindegyikben kiszámolhatjuk a megfelelõstatisztika értékét. Ezek az értékek mind a populáció- paraméterbecslései lesznek, és ha a becslés torzítatlan, akkor apopuláció-paraméter körül fognak ingadozni. Már viszonylag kisszámú populációból is nagyon nagyszámú mintát vehetünk, melyekbenaz adott statisztikák értékei bizonyos eloszlást fognak követni.

  10. Statisztikák elméleti eloszlása Az átlagot például véve tekintsünk egy populációt,amelyben egy bizonyos X véletlen változó normál eloszlást követµ átlaggal, és σ szórással (X ~ N(µ, σ) ). Ha ebbõl apopulációból 30 elemû mintákat veszünk, akkor a minták átlaganormál eloszlást fog követni melynek várható értéke(átlaga) megegyezik az eredeti véletlen változó X átlagával: szórása pedig egyenlõ lesz az X szórásának és amintaelemszám gyökének hányadosával. Azt hogy a mintaátlagok, apopulációátlag becslései mennyire ingadoznak a populációátlag (amiegyenlõ a mintaátlagok elméleti eloszlásának átlagával) körül, amintaátlagok elméleti eloszlásának szórása fejezi ki.

  11. A becslés standard hibája Ez az érték tehát a becslések hibájának nagyságátfejezi ki és a becslés standard hibájának (SE) nevezzük. Tehát abecslés standard hibája megegyezik a becslõ statisztika elméletieloszlásának szórásával. Ha a populáció szórása nem ismert, akkor a minta szórásával becsülhetjük, így a standard hiba becslése:

  12. A becslés standard hibája Mint a standard hiba képletébõl is látható, azelemszám növelésével a standard hiba csökken, azaz a becslő statisztikák átlagosan egyre kisebb hibával becslik a populációátlagát. A becslés standard hibájával kapcsolatos a becslés két további fontos ismérve, a hatékonyság, ami arra utal, hogy a becslés kis hibával közelíti a becsülendő paramétert, és a konzisztencia, ami arra utal, hogy a mintanagyság növelésével a becslő statisztika elméleti eloszlásának szórása, vagyis standard hibája, egyre kisebb lesz.

  13. Intervallumbecslés Az eddigiekben tárgyalt becslést pontbecslésneknevezzük, mert a becsülendõ populáció-paraméter becslésekéntegyetlen értéket, egyetlen pontot adunk meg. Láttuk, hogy a mintaelemszámának növelésével a becslés egyre pontosabb lesz, depontosan ritkán fog megegyezni a populáció-paraméterrel. A statisztikai becslés egy másik típusát az ún. Intervallumbecslésjelenti, amikor nem pontos értéket adunk meg a populációparaméterbecsléseként, hanem egy tartományt, intervallumot, amibe abecsülendõ paraméter bizonyos valószínûséggel bele fog esni. Ezt avalószínûséget a becslés megbízhatóságának, konfidenciájánaknevezzük, az intervallumot pedig megbízhatósági tartománynak, vagykonfidencia intervallumnak.

  14. Intervallumbecslés Az átlagok példájánál maradva: láttuk, hogy amintaátlagok normál eloszlást követnek µ várható értékkel ésszórással. Ha 95%-os konfidenciaintervallumot szeretnénk az átlagra, akkor meg kell adnunk azt atartományt, ami a populációátlagot 95%-os valószínûséggeltartalmazza. Standard normál eloszlás esetén az értékek 95%-osvalószínûséggel a -1.96 és 1.96 szórásnyi tartományba esnek, tehátaz átlag esetén a -1.96*,1.96* tartomány lesz a 95%-os konfidenciaintervallum.

More Related