350 likes | 1.06k Views
Statisztikai alapismeretek - Leíró statisztika 2. EMPIRIKUS ELOSZLÁSOK KÖZÉPÉRTÉKEK. - Egyedi és csoportosított adatok - középértékek - kvantilisek - szóródás. 2010 febr 16. Csoportosított adatok. Csoportosítás : a sokaságnak valamely ismérv szerinti tagolása:.
E N D
Statisztikai alapismeretek - Leíró statisztika 2. EMPIRIKUS ELOSZLÁSOKKÖZÉPÉRTÉKEK - Egyedi és csoportosított adatok - középértékek - kvantilisek - szóródás 2010 febr 16
Csoportosított adatok Csoportosítás: a sokaságnak valamely ismérv szerinti tagolása: • Minőségi ismérv szerint: pl. férfi és nő; stb. • Mennyiségi ismérv szerint: • Pl. 0, 1, 2, 3 gyerekes családok • Alkalmazottak csoportosítása kereseti intervallumok • szerint
Abszolút és relatív gyakoriság Az abszolút gyakoriság azt mutatja, hogy egy-egy csoportba (osztályba osztályközbe) a sokaságnak hány egysége tartozik. (Pl. 40 családból 20 a 2-gyerekes) A relatív gyakoriság (megoszlási viszonyszám): az adott csoportba a sokaságnak hányad része (hány %-a) tartozik. (Pl. a 2 gyerekes családok aránya 0,5, vagyis 50%.)
A relatív gyakoriság kiszámítása Abszolút gyakoriság = fi Sokaság elemszáma = n Relatív gyakoriság = gi A relatív gyakoriságot sokszor %-os formában fejezzük ki.
Kumulált gyakoriság Kumulálás = halmozott (göngyölített) összeadás A (felfelé) kumulált gyakoriságok (fi’) és relatív gyakoriságok (gi’) azt mutatják, hogy az első i osztályközben hány adat, illetve az adatok hányad része található. A lefelé kumulált gyakoriságok(fi” és gi”) az i-edik és az azt követő osztályközökben hány adat, illetve az adatok hányadrésze található.
Példa kumulált gyakoriságra 10 / 200
Sűrűség Sűrűség: (adatsűrűség) egységnyi osztályközre jutó gyakoriság (vagy relatív gyakoriság) . Szemléletesen: milyen sűrűn helyezkednek el az adatok a számegyenesen V.ö. Népsűrűség: egységnyi területre jutó lakosok száma
Hisztogram A hisztogram olyan oszlopdiagram, amelyen az oszlopok területe arányos a gyakorisággal. A vízszintes tengelyen: az osztályközök A függőleges tengelyen: a sűrűség: az egységnyi osztályközre jutó (relatív) gyakoriság. • FIGYELEM! • Nem egyenlőosztályközök esetén csak a sűrűség lehet a függőleges tengelyen! • Egyenlőosztályközök esetén a (relatív)gyakoriság is jó, mert az arányos a sűrűséggel.
A gyakorisági eloszlások mutatói: a középértékek Az eloszlás további jellemzésére szolgáló mutatók a következők: Középértékek: • átlagok • módusz • medián Kvantilisek
Az értékösszeg-sor Értékösszeg: az adott csoportra jellemző xi érték (osztályközös gyakorisági sornál az osztályközép) és a gyakoriságfi szorzata Relatív értékösszeg:
A számtani átlag A számtani átlag: az egyes átlagolandó értékek összege osztva az adatok számával Ez a súlyozatlan átlag, egyedi, nem ismétlődő adatok esetén Az átlag egy intenzitási viszonyszám: egy adatra jutó értékösszeg
A súlyozott számtani átlag Ismétlődő (és csoportosított) értékeknél az értékösszegek az egyes ismérvértékekhez tartozó gyakoriságokkal számolhatók ki: k = hány különböző adat van; ill. a csoportok száma
A számtani átlag osztályközös gyakorisági sor esetén. Osztályközös gyakorisági sor esetén a számtani átlag képletében szereplő xi az osztályközepet jelenti. Kiszámítása: Az osztályköz alsó és felső határát mutató számot összeadjuk, és 2-vel elosztjuk
Megjegyzendő! NOTA BENE! 1. Az egyszerűátlag a súlyozott speciális esete. • Súlyként az abszolút és a relatív gyakoriságok is használhatók. • Fiktív súlyok is használhatók relatív fontosság érvényesítésére • Tizedes tört és százalék %: a relatív gyakoriság használatakor a képlet • Tizedes tört esetén: • százalékos forma esetén:(a g %-ban!)
A számtani átlag tulajdonságai I. • Minden egyes xiérték helyébe az átlagot írva, az értékösszeg nem változik. • Az átlag mindig a legkisebb és legnagyobb érték közé esik. • Ha az átlagolandó értékek mindegyikéhez ugyanazt a d konstans számot hozzáadjuk, akkor az átlag is d-vel nő meg. • Ha az átlagolandó értékek mindegyikét ugyanazzal a konstans számmal (k) megszorozzuk, akkor az átlag is k-szorosára változik.
A számtani átlag tulajdonságai II. 5. A részátlagok és a főátlag közötti összefüggés A sokaságot két csoportra osztva: A részátlagok: A főátlag:
Harmonikus átlag A harmonikus átlag az a szám, amellyel az átlagolandó értékeket helyettesítve azok reciprokainak összege nem változik. Megj.: a képletben szereplő si ill. az zi itt nemcsak az értékösszeget ill a rel. é.ö.-et jelentheti, hanem általánosan a súlyt, ill. súlyarányokat!
A harmonikus átlag használata Amikor a reciprok értékek összegének értelme van. Egyik fontos felhasználási mód az, amikor számtani átlagot kellene számolnunk, de a tényleges gyakoriságok nem, csak az értékösszegekek ismertek (vagy azok arányai).
Példa a harmonikus átlagra Egy felmérésben gyerekes családokat kérdeztek meg. Ennek alapján az alábbi táblázat készült.
Mértani átlag Kiszámítása: Az átlagolandó értékek szorzatából az értékek számának megfelelő (n-edik) gyököt vonunk. A mértani átlag (xg) az a szám, amellyel az átlagolandó értékeket helyettesítve azok szorzata változatlan marad. Pl. Láncindexek átlagolása:
A mértani átlag használata Akkor indokolt, ha az átlagolandó értékek szorzata értelmezhető. Például az inflációs ráta (CPI) 2000-ben 1,10 2001-ben 1,08 2002-ben 1,05 volt. (124,7 %) A szorzat jelentése: 3 év alatt 24,7 %-kal nőttek az árak. Kérdés: Mennyi az átlagos éves inflációs ráta?
Megoldás Az árak évenként átlagosan 7,6 százalékkal nőttek. Az árak évente átlagosan 1,076-szeresükre nőttek az előző évhez képest.
A négyzetes átlag A négyzetes átlagot úgy számítjuk ki, hogy • az átlagolandó értékek négyzeteit összeadjuk, • elosztjuk az elemek számával, • és az eredményből négyzetgyököt vonunk. A négyzetes átlag az a szám, amellyel az átlagolandó értékeket helyettesítve, azok négyzetösszege nem változik.
A négyzetes átlag használata Akkor használjuk, amikor az átlagolandó értékek között pozitív és negatív számok egyaránt vannak, de a vizsgálati cél szempontjából az előjelnek nincs jelentősége. Erre a szóródás elemzése során látunk majd példát.
A módusz (Mo) 1. Diszkrét ismérv esetén a leggyakrabban előforduló ismérv-érték Az az érték, amelyhez a legnagyobb (abszolút vagy relatív) gyakoriság tartozik. 2. Nem ismétlődő vagy folytonos adatok esetén Az az érték, amely körül a leginkább sűrűsödnek az adatok. Osztályközös gyakorisági sornál helye a legnagyobb sűrűségű osztályköz, ezen belül az értékét csak becsülni tudjuk.
A módusz becslése a modális osztályközben xi0=modális oszt.köz alsó határa k1 és k2 = a modális illetve az előző és a következő osztályközhöz tartozó sűrűség különbsége hi= a modális osztályköz hossza FIGYELEM! Nem egyenlő osztályközök esetén k1 és k2 csak a sűrűség mutatóiból számolható!
Példa (módusz, Mo) Egy zárthelyi dolgozaton 100 pontot lehetett elérni. A többszáz fős évfolyam összesített eredményét az alábbi táblázat mutatja. • Mennyi az átlagpontszám az évfolyamon? • Készítsen hisztogramot! • Becsülje meg és értelmezze a móduszt!
A medián (a középső érték) A medián (Me): a sorba rendezett ismérvértékek közül a középső Ha a sokaság elemeinek száma páros, akkor a két középsőhöz tartozó átlaga. A Me-nálkisebbelemek száma megegyezik a Me-nál nagyobb elemek számával. Megj. A valsz-ban: az az x érték, amelyre F(x) = ½ (ha létezik)
Pl. a mediánra (a középső érték)egyedi értékek esetén a) 5 8 12 15 18 19 22 26 27 32 41 45 49 b) 1 8 12 15 18 19 22 26 27 32
Az osztályközös gyakorisági sor mediánja n/2 = a sokaság fele (a medián sorszáma) xi0 = a mediánt tartalmazó osztályköz alsó határa hi = az osztályköz hossza fi = a mediánt tartalmazó osztályköz gyakorisága f’i-1 = a mediánt megelőző osztályköz kumulált gyakorisága
A medián rokonai, a kvantilisek Típusai: • A medián a sokaságot 2 egyenlő részre osztja • A 3 quartilis a sokaságot 4 egyenlő részre osztja • A 4 quintilis a sokaságot 5 egyenlő részre osztja • A 9decilis a sokaságot 10 egyenlő részre osztja • A 99 percentilis a sokaságot 100 egyenlő részre osztja • A p-ed rendű kvantilis (0< p < 1) a sokaság elemeit p : (1-p) arányban osztja ketté.