470 likes | 662 Views
STATISZTIKA II. 3. Előadás. Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék. Olyan jelenségek, amelyek a véletlentől függő értéket vesznek fel. Intervallumbecslés FAE mintából. A sokasági átlagra (várható értékre), a sokasági varianciára ,
E N D
STATISZTIKA II.3. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék
Olyan jelenségek, amelyek a véletlentől függő értéket vesznek fel
Intervallumbecslés FAE mintából A sokasági átlagra (várható értékre), a sokasági varianciára, a sokaság egy arányára (népességen belül a sokgyermekes családok arányára).
Intervallumbecslés FAE mintából Az átlag és arány becslés esetében normális eloszlással jól közelíthető: • az előírt szabványoktól való eltérés (hiba) (minőségellenőrzés), • nem normális, de szimmetrikus eloszlás nem túl kis minták esetében (30<n), • erősen ferde, nem szimmetrikus eloszlás nagy minta elemszám esetében (100<n).
Intervallumbecslés FAE mintából A sokasági várható érték becslésének két esete: • Sokasági szórás (variancia) ismert • Sokasági szórást a mintából kell becsülni
Intervallumbecslés FAE mintából • Sokasági szórás (variancia) ismert változó standard normális eloszlású, de ha a szórást a mintából kell becsülni s2-tel (korrigált tapasztalati szórás), akkor a standardizálás így nem végezhető el.
Intervallumbecslés FAE mintából • Sokasági szórást a mintából kell becsülni A t változó Student (t) eloszlást követ n-1 szabadságfokkal. A Student (t) eloszlás hasonlít a standard normális eloszláshoz: • szimmetrikus, • a szabadságfok (minta nagyság) növekedésével tart a normális eloszláshoz. Ezért nagy minták esetén az ismert és a becsült szórás közelít egymáshoz.
Intervallumbecslés FAE mintából Sokasági szórás ismert (nem kell becsülni): a megadott megbízhatósági szinthez meghatározzuk a z szorzót, majd az összefüggésből kiszámítjuk a konfidencia-intervallum alsó és felső határait.
Intervallumbecslés FAE mintából A sokasági szórás nem ismert: a mintából torzítatlanul kell becsülni majd a megfelelő szabadságfokú t-eloszlás táblázatból meghatározzuk a értéket. Ezután az összefüggésből kiszámítjuk a konfidencia-intervallum alsó és felső határait.
Intervallumbecslés FAE mintából a várható érték konfidencia-intervallumának alsó és felső határa: Formalizálva:
Intervallumbecslés FAE mintábóla mintanagyság meghatározása ismert sokasági szórás esetén a összefüggésből indulunk ki, és ezt rendezzük át n-re Ez után rögzítve a megbízhatósági szintet és a hibahatárt, a szórás ismeretében kiszámíthatjuk a szükséges minta elemszámát.
7.6. példa A félliteres zacskós tejet automata csomagolja. FAE minta alapján becsüljük az átlagos töltési mennyiséget, készítsünk 95%-os megbízhatósággal intervallum becslést ! (eloszlás normális, szórás nem ismert)
Ugyan ebben az esetben a mintanagyság meghatározása ismert szórás esetén:
Arány (valószínűség) intervallumbecslés K: a sokaság egy meghatározott tulajdonságával rendelkező elemeinek száma pl. egy adott jövedelemszint alattiak száma P: a sokasági arányt Pontbecslés (a mintából számított hasonló arány):
Arány (valószínűség) intervallumbecslés Ez a p FAE minta esetében binomiális eloszlást követ Elegendően nagy minta esetén a binomiális eloszlás jól közelíthető normális eloszlással P 0,5 körül kis minta P 0 vagy 1 körüli nagy minta
Arány (valószínűség) intervallumbecslés általános hüvelykujjszabály: • P=0,5 legalább 20 elemű minta • P=0,1 vagy P=0,9, legalább 100 elemű minta szükséges a normális eloszláson alapuló közelítéshez
Arány (valószínűség) intervallumbecslés Ha a minta elegendően nagy, akkor és a standard normális eloszlás alkalmazható
Arány (valószínűség) intervallumbecslés Így a konfidencia-intervallum: ahol egyenlet megoldásának eredményeként kapjuk.
Arány intervallumbecslése mintából 7.7. példa A KSH által 2004-re közölt munkanélküliségi adatok ellenőrzésére 1500 elemű véletlen mintát vettek. A mintában a munkanélküliségi ráta 6,3% (p1=0,063), az aktivitási ráta 53,6% (p2=0,536) volt. A becslést 95,5% megbízhatóságon elvégezve (z=2) a következőket kapták:
Arány intervallumbecslés minta elemszáma Kiindulva a A mintanagyság meghatározása A becsülni kívánt arány ismeretlen, de P=0,5-nél maximumot ad: max P(1-P)=0,25 így P-től függetlenül is használható.
Sokasági variancia becslés vagy a torzítatlan Nézzük az s2 eloszlását……..
Sokasági variancia becslés Ha Y (és yi) normális eloszlású változók, akkor bizonyítható, hogy az változó n-1 szabadságfokú -eloszlást követ. Az eloszlás nem szimmetrikus, ezért az alsó és felső szélén kijelölt valószínűség nem egyforma hosszúságú intervallumot jelent. A konfidencia-intervallum nem szimmetrikus a pontbecslésre.
7.8. példa Egy teszt magnetofon esetében 10 (alkalommal), egymástól független szalagsebességet mértek (cm/sec). A minta alapján becsüljük (normális eloszlást feltételezve) az ingadozást mérő szórásnégyzetet (szórást) és 90%-os konfidencia intervallumát.