370 likes | 637 Views
Normális eloszlású, ismert szórású sokaság. Példa: A kávékivonatot automata tölti az üvegekbe. Előző adatfelvételekből ismeretes, hogy a gép által töltött tömeg normális eloszlású valószínűségi változónak tekinthető, 1 g szórással.
E N D
Normális eloszlású, ismert szórású sokaság. Példa: A kávékivonatot automata tölti az üvegekbe. Előző adatfelvételekből ismeretes, hogy a gép által töltött tömeg normális eloszlású valószínűségi változónak tekinthető, 1 g szórással. A gép pontosságának ellenőrzésére vett 16 elemű mintában (FAE-minta) az üvegekben lévő kávé-granulátum tömege (gramm): 55, 54, 54, 56, 57, 56, 55, 57, 54, 56, 55, 54, 57, 54, 56, 50. Készítsen 95%-os megbízhatósággal intervallumbecslést az átlagos töltőtömegre a megadott feltételek alapján. 1. lépés mintaátlag: 2. lépés: szórás: 3. lépés standard hiba:
4. lépés Z értéke az I. Táblázatból 95%-nál:1,96 5. lépés a hibahatár: 6. lépés a konfidencia intervallum: azaz {54,51; 55,49} Tehát 95%-os megbízhatósággal az átlagos töltőtömeg 54,51 és 55,49 gramm közé esik.
Normális eloszlású, ismeretlen szórású sokaság, nagy minta. Példa: 1250 elemű sokaságból 125 elemű EV mintát veszünk az alma piaci árának megfigyelésére. N = 1250 n = 125 1. lépés mintaátlag:
2. lépés szórás:
3. lépés standard hiba:
4. lépés Z értéke az I. Táblázatból 95%-nál:1,96 5. lépés hibahatár: 6. lépés konfidencia intervallum: azaz {38,977; 41,023}
Normális eloszlású, ismeretlen szórás és kis minta. Példa: A félliteres zacskós tej töltési mennyiségének ellenőrzésére 10 elemű FAE mintát veszünk. A sokaság szórását nem ismerjük. Milyen intervallumba esik az átlagos töltősúly 95%-os valószínűség mellett? 1. lépés mintaátlag: 2. lépés szórás:
3. lépés standard hiba: 4. lépés „t” kikeresése, (fordítva kell keresni, mint a „z” esetében), a 0,95-höz tartozó értéket keressük a III. Táblázat megfelelő szabadságfokú sorában. szabadságfok v = n-1 = 9 t = 2,2622 5. lépés hibahatár: 6. lépés a konfidencia intervallum: {490,47; 503,53}
Ismeretlen eloszlás, ismert szórás (kis minta). (Csebisev egyenlőtlenség) A korai paradicsom ármegfigyelésére kiválasztottak 225 árusítóhelyet. A kiválasztott mintában a paradicsom átlagára 180 Ft/kg volt. A mintaátlagok eloszlásáról nincs információnk. A minta szórása 45 Ft/kg. Határozzuk meg a paradicsom piaci átlagárának konfidencia intervallumát 95%-os megbízhatósággal, a Csebisev-féle egyenlőtlenség felhasználásával! s = 45; n = 225; 1-α = 0,95; α = 0,05; 1. lépés mintaátlag: s = 45 2. lépés szórás: 3. lépés a standard hiba: 4. lépés a standard hiba szorzószáma "k".
5. lépés a hibahatár: 6. lépés a konfidencia intervallum: 180 ± 13,416 azaz [166,6; 193,4]
Szimmetrikus eloszlás, ismert szórás.(GAUSS-féle egyenlőtlenség) • Az előző példából csak a standard hiba szorzószáma változik: • A konfidencia intervallum: • 180 ±8,944 = 188,9;171
Értékösszeg becslés. Az átlagra kapott becslést, illetve a konfidencia intervallum alsó és felső értékét megszorozzuk a sokaság elemszámával. Példa: A magyarországi kocsmai verekedések vizsgálatára véletlenszerűen, visszatevéses módszerrel, 100 kocsmát választottak ki az ország területén. Egy adott napon megfigyelt eredményeket a következő táblázat tartalmazza: Tegyük fel, hogy a sokasági szórás 1,7. Feladat: Összesen hány ember verekedett kocsmákban az adott napon 95%-os meg-bízhatósággal, ha Magyarországon 85 000 kocsma található? 1. lépés mintaátlag:
2. lépés szórás: 3. lépés standard hiba: 4. lépés Z értéke az I. Táblázatból 95%-nál: 1,96 5. lépés a hibahatár: 6. lépés a konfidencia intervallum az átlagra: azaz {3,37; 4,03} 7. lépés a konfidencia intervallum az értékösszegre: képlet alapján 85 000 x 3,37 = 286 450 fő 85 000 x 4,03 = 342 550 fő
Sokasági arány becslése. Példa: Egy 9000 lakosú városban közvélemény kutatást végeztek az inflációs várakozásokról. Az 1800 megkérdezett közül 630-an számítanak a tervezettnél nagyobb áremelkedésre. Határozza meg, hogy 95%-os valószínűséggel milyen határok közé esik a tervezettnél nagyobb áremelkedésre számítók aránya. N = 9000 n = 1800 a kedvező esetek száma= k = 630 1. lépés arány a mintában: 1-p = 0,65 2. lépés szórás a mintából: 3. lépés a standard hiba: (EV)
4. lépés a "z" meghatározása a táblázatból: 95%-os valószínűségnél z = 1,96; 5. lépés a hibahatár megállapítása: 6. lépés a konfidencia intervallum: p ± Δ = 0,35 ± 0,0196 [0,3304; 0,3696]
A minta nagyságának meghatározása. Példa: Mekkora nagyságú EV mintát kell venni egy 12500 elemszámú sokaságból a sokaság várható értékének becsléséhez, hogy 95%-os valószínűség mellett a hiba ne haladja meg az 1,08 hibahatárt, ha az alapsokaság szórása 6,16. N= 12500; σ= 6,16; Δ= 1,08; z= 1,96
Becslés rétegzett mintából. Példa: Egy vállalat dolgozóinak kereseti adatai. Határozzuk meg 95%-os valószínűséggel a sokaság átlagbérének konfidencia intervallumát. Ha "j" számú réteg van, akkor Nj = a j-edik réteg elemszáma nj = a j-edik réteg elemszáma a mintában σj = a j-edik réteg szórása 1. lépés a mintából számított átlag:
2. lépés a standard hiba: 3. lépés a "z" meghatározása a táblázatból: 95%-os valószínűségnél z = 1,96 4. lépés a hibahatár: 5. lépés a konfidencia intervallum: [63,44; 66,16]
Hipotézisvizsgálat. • A sokaságból vett minta alapján azt vizsgáljuk, hogy helyes-e a sokaságra vonatkozó feltételezésünk. • A tesztelni kívánt feltételezés: a null-hipotézis. • A szemben álló hipotézis: az alternatív hipotézis. • A null-hipotézisünk helyességének megállapításáhozpróbafüggvénythasználunk. A próbafüggvénynek a mintából számított értéke alapján hozzuk meg a döntésünket.
A függvény értékkészletét kettéválasztjuk: • A nullhipotézis helyessége esetén a próbafüggvény értéke adott valószínűséggel az elfogadási tartományba esik. • A nullhipotézis helytelensége esetén a próbafüggvény értéke a visszautasítási tartományba esik. Döntésünket adott valószínűség mellett hozzuk. Ez a megbízhatósági szint (1-α, pl. 95%). Annak a valószínűsége, hogy helyes nullhipotézis esetén a próbafüggvény értékea visszautasítási tartományba esik, az a szignifikancia szint (α, pl. 5%). Elsőfajú hiba: elvetjük a null-hipotézist, noha megfelel a valóságnak. Másodfajú hiba: elfogadjuk a null-hipotézist, noha az nem felel meg a valóságnak.
Egymintás „Z” próba. (Ismert szórású normális eloszlás) Egy ellenőrző vizsgálatnál a 100 dkg-osnak feltüntetett csomagokból választottak egy 50 elemű FAE mintát. A minta átlag 98 dkg volt. Az alapsokaság szórása előzetes vizsgálatokból ismert 3 dkg. 95%-os megbízhatósági szinten vélelmezhetjük-e, hogy az alapsokaságban az átlagsúly 100 dkg? n = 50 = 3 = 98 1. lépésA nullhipotézis felállítása: μ = 100 (kétoldalú próba) 2. lépésA próbafüggvény értékének a kiszámítása a mintából: (191. képlet)
3. lépésaz elfogadási tartomány megállapítása. Ez kétoldalú próba, a 95%-os valószínűséghez az I. táblázatban z=1,96 érték tartozik, tehát az elfogadási tartomány (-1,96; +1,96). A kapott érték ezen kívül esik: - 4,71 < - 1,96, így elvetjük a null-hipotézist. Nem tekinthetjük 100 dkg-osnak a sokaságban az átlagsúlyt.
95%-os megbízhatósági szinten vélelmezhetjük-e, hogyaz alapsokaságban az átlagsúly legalább 100 dkg? a nullhipotézis: (baloldali próba) a próbafüggvény értéke: Egyoldalú próba a II. táblázatban a 95%-os valószínűséghez z =1,64 érték tartozik. Az elfogadási tartomány A kapott érték ezen kívül esik, nem fogadjuk el a nullhipotézist. 1. lépés 2. lépés 3. lépés
Egymintás „t” próba. (Ismeretlen szórású normális eloszlás, kis minta.) A félliteres zacskós tej töltési mennyiségének ellenőrzésére 10 elemű FAE mintát veszünk. A sokaság szórását nem ismerjük. Az a hipotézisünk, hogy 95%-os valószínűséggel állítható, hogy az alapsokaságban az átlagos töltősúly 500 gramm. 1.) A null-hipotézis: = 500 (kétoldalú próba)
2.)Az átlag a mintából: 3.) A szórás a mintából: 4.) A próbafüggvény „t” próba esetén: 5.) 95%-os valószínűség és v = n-1 = 9 szabadságfok mellett kikeressük „t” értékét a III. táblázatból t = 2,2622, az elfogadási tartomány (-2,2622; 2,2622). A próbafüggvény értéke (-1,038) az elfogadási tartományba esik, tehát elfogadjuk azt a null-hipotézisünket, hogy a félliteres zacskós tej átlagos töltősúlya 500 gramm.
Sokasági arányra irányuló próba. • Egy biztosítótársaság feltevése szerint a vállalati igazgatók egynegyedének van életbiztosítása. A hipotézis ellenőrzésére kiválasztottak 1000 vállalatot. A mintában szereplő igazgatók közül 226-nak volt életbiztosítása. • Állapítsuk meg 5%-os szignifikancia szinten a feltevés helyességét. • lépés • A null-hipotézis: P0 = 0,25 • Az alternatív hipotézis: P0 0,25, tehát két oldalú próba.
2. lépés A próbafüggvény: n = 1000; k = 226; 3. lépés A 95%-os megbízhatósági szinthez tartozó „z” érték 1,96. Az elfogadási tartomány: - 1,96, 1,96 között van. A próbafüggvény értéke az elfogadási tartományba esik, tehát elfogadjuk azt a hipotézist, hogy az igazgatók egynegyedének van életbiztosítása. 4. lépés
Kétmintás „Z” próba. Az a feltételezésünk, hogy a téli alma átlagára a szegedi és a miskolci piacon megegyezik. Ennek ellenőrzésére a szegedi piacokon 100 elemű, a miskolci piacokon 144 elemű mintát vettünk. A mintabeli átlagárak: Az árak szórása: Szegeden = 90 Ft Szegeden σ1=15 Ft Miskolcon = 85 Ft Miskolcon σ2=12 Ft Igaz-e a feltételezésünk 5%-os szignifikancia szint mellett?
1. lépés A nullhipotézis: 2. lépés A próbafüggvény: 3. lépés Az 5%-os szignifikancia szinthez a Z= 1,96 tartozik, az elfogadási tartomány +1,96 és –1,96 „z” értékek között van. 2,78 > 1,96 tehát elutasítjuk a null-hipotézist, azaz szignifikáns eltérés van az alma átlagárában a két városban.
Függetlenségvizsgálat: χ² próba. (Alkalmazási feltétele: a kombinációs tábla minden cellájában több, mint 10 elem.) A tanulók megoszlása lakóhely és tanintézet szerint. (fij) j=1 i=1 1. lépés Nullhipotézis:a tanulók lakóhely, és tanintézeti megoszlása független egymástól. Szignifikancia szint : 1%
2. lépés a próbafüggvény: 3. lépés a szabadságfok: v = (r-1) (c-1) = (3-1) (4-1) = 6 Jobboldali próba eseténaz V. táblázatban az oszlopban, v = 6 sorban szereplő értéket keressük. Ez 16,812; 20,71 > 16,812, tehát elutasítjuk a null-hipotézist. (r = a sorok száma; c = az oszlopok száma) 4. lépés
Több mintás próbák. F-próba (variancia analízis). Több normális eloszlású és hasonló szórásnégyzetű részsokaság átlagának egyezőségét teszteljük. A null-hipotézis: a részsokaságok várható értéke (átlaga) azonos. μ1= μ2=μ3= ……….= μM ahol a részsokaságok száma j= 1, 2, ......M Minden részsokaságból mintát veszünk. Egy adott részminta elemszáma: nj A teljes minta elemszáma: Σnj = n
Példa. Tizenöt napon keresztül megfigyelték négy dolgozó átlagos teljesítményét. A teljesítményeket az alábbi táblázat mutatja. Ellenőrizzük 95%-os megbízhatósággal azt a hipotézist, hogy nincs szignifikáns eltérés a négy dolgozó átlagos teljesítménye között. A részsokaságok: a négy dolgozó napi teljesítményei (M=4) A részsokaságokból vett minták (nj): négy dolgozó napi teljesítményei 15 napon keresztül Az egyes minták elemszáma: j = 1,2,…..15 A teljes minta (n): Σ nj = n = 60
1.) 2.) Belső eltérés négyzetösszegSSB = 3.) Külső eltérés négyzetösszegSSK =
4.) A próbafüggvény: 5.) (202) képlet Szabadságfok: v1= M –1 = 4 - 1 = 3 (a részsokaságok száma mínusz 1) v2= n – M=60-4=56(a teljes minta elemszáma mínusz a részsokaságok száma) 6.) Ilyen szabadságfok mellett az F függvény VI. táblabeli értéke 95%-os megbízhatósági szinten F=2,79. Miután jobboldali próba az elfogadási tartomány (0; 2,79). A próbafüggvény tapasztalati értéke az elfogadási tartományba esik. Tehát nincs szignifikáns eltérés a négy dolgozó átlagos teljesítménye között.