420 likes | 583 Views
Gazdaságstatisztika. LEÍRÓ STATISZTIKA I I. 3. előadás 2013. szeptember 18. Adatok csoportosítása, osztályozása. A mennyiségi sorok grafikus ábrázolásának alapját a gyakorisági táblázat készítése jelenti. Osztályba sorolás (folytonos adatok és nagyszámú diszkrét megfigyelés esetén);
E N D
Gazdaságstatisztika LEÍRÓ STATISZTIKAII. 3. előadás 2013. szeptember 18.
Adatok csoportosítása, osztályozása • A mennyiségi sorok grafikus ábrázolásának alapját a gyakorisági táblázat készítése jelenti. • Osztályba sorolás (folytonos adatok és nagyszámú diszkrét megfigyelés esetén); • gyakoriságok (fi) megállapítása; • relatív gyakoriságok (gi) megállapítása • összegzett (kumulált) gyakoriságok (fi’), illetve összegzett relatív gyakoriságok (gi’) megállapítása; • gyakorisági táblázat készítése (fi , gi , fi’ , gi’ adataiból); • gyakorisági (relatív gyakorisági), illetve összegzett gyakorisági (relatív gyakorisági) hisztogramok (folytonos adatok esetén a poligon és az ogiva) felvétele (tapasztalati eloszlások elkészítése); • grafikus ábrázolás
Példa – kevés számú diszkrét adat (24 óra alatti gépleállások
Relatív gyakoriságok gyakoriságok 0,2 5 0,16 4 0,12 3 2 0,08 1 0,04 0 1 2 3 4 5 6 Leállások száma Példa – kevés számú diszkrét adat Adatok ábrázolása: PÁLCIKA DIAGRAM
1 Kumulált relatív gyakoriságok 0,5 Leállások száma 0 4 1 2 5 3 6 Példa – kevés számú diszkrét adat Kumulált relatív gyakoriság ábrázolása:
Példa – nagy számú folytonos adat GYAKORISÁGI HISZTOGRAM (tapasztalati sűrűségfüggvény) Gyakoriság vonaldiagramja
Példa – nagy számú folytonos adat Gyakorisági görbe
Példa – nagy számú folytonos adat Ogiva KUMULÁLT RELATÍV GYAKORISÁG VONALDIAGRAMJA (tapasztalati eloszlásfüggvény)
Középértékek Helyzeti Számított Módusz Számtani átlag Mértani átlag Medián Harmonikus átlag Négyzetes átlag Tapasztalati eloszlásokjellegzetességei Középérték-mutatók: helyzeti és számított Ingadozásmutatók: abszolút és relatív Alakmutatók • Középérték elvárások: • Közepes helyzetűek • Tipikusak • Egyértelműen meghatározhatóak • Lehetőleg könnyen értelmezhetőek
Medián • Helyzeti középérték – valódi középérték, a rangsor közepén található: az az érték, amelynél az előforduló értékek fele kisebb, fele pedig nagyobb • Páratlan számú adatnál a középső • Páros számú adatnál a két középső érték számtani átlaga • Mindig meghatározható • Érzéketlen a szélsőértékekre, és nem függ a többi ismérvértéktől sem • Sok egyforma ismérvérték esetén azonban nem tanácsos használni ha 1 0 6 17 23 13 3 2 19 1 0 6 17 23 13 3 2 0 1 2 3 6 13 17 19 23 0 1 2 3 6 13 17 23 4,5
Medián – diszkrét példa Páros számú adat esetén a rangsor két középső számának átlaga: a 12. és 13. adat értéke is 2, így a medián értéke 2
Medián – folytonos példa Páratlan számú adat esetén a rangsor középső tagja: ez a rangsor 50. tagja (ennél 49 kisebb és 49 nagyobb érték fordul elő)
Medián becslése A mediánt tartalmazó osztály bal végpontja. me annak a legelső osztályköznek a sorszáma, amelyre igaz, hogy A mediánt tartalmazó osztály hossza.
Módusz • Helyzeti középérték – tipikus • Diszkrét ismérv esetén a leggyakrabban előforduló ismérvérték • Folytonos ismérv esetén pedig a gyakorisági görbe maximumhelye • Nem mindig határozható meg egyértelműen, nem mindig létezik • Érzéketlen a szélsőértékekre, nem függ a többi ismérvértéktől sem • Becslése bizonytalan • Nyers módusz
Módusz – diszkrét példa A gyakorisági sorban egynél több kiugró gyakoriság fordul elő. Nem határozható meg egyértelműen, célszerű más középérték mutatót is számítani.
Módusz – folytonos példa Folytonos esetben a legnagyobb gyakoriságú osztály tartalmazza.
Módusz becslése moa legnagyobb gyakoriságú osztály(ok) sorszáma A móduszt tartalmazó osztály bal végpontja. A móduszt tartalmazó osztály hossza.
Számtani átlag • Az a szám, amellyel az átlagolandó számértékeket helyettesítve azok összege változatlan marad • Leggyakrabban használt középérték • Meghatározható gyakorisági sorból is a gyakoriságokkal súlyozva • Számított középérték-mutató • Bármely alapadathalmazból egyértelműen meghatározható • Minden alapadatot felhasznál • Érzékeny a szélsőértékekre • Nyesett átlag min. ,ha
Harmonikus átlag • A harmonikus átlag az a szám, amellyel az átlagolandó értékeket helyettesítve azok reciprokainak összege változatlan marad. Mértani átlag • A mértani átlag az a szám, amellyel az átlagolandó értékeket helyettesítve azok szorzata változatlan marad.
Négyzetes átlag • Az a szám, amellyel az átlagolandó értékeket helyettesítve, azok négyzetösszege változatlan marad • Tipikus alkalmazási területe a szórásszámítás Választás a középértékek között
Választás a középértékek között • Módusz, medián, számtani átlag? • Melyiket használjuk? • Egyértelműen meghatározható-e? • Az összes rendelkezésre álló adattól függ-e vagy sem? • Mennyire érzékeny a szélsőségesen nagy vagy kicsi értékekre? • Mekkora és milyen módon értelmezhető hibával képes helyettesíteni az alapadatokat?
Választás a középértékek között • Medián • Egyértelműen meghatározható, mindig létezik • Ha sok az egyforma ismérvérték, akkor nem tanácsos használni • Nem függ sem az összes értéktől, sem a szélsőséges értékektől • Módusz • Nem mindig határozható meg egyértelműen, nem is mindig létezik • Becslése bizonytalan (függ az osztályok kialakításától) • Nem függ sem az összes értéktől, sem a szélsőséges értékektől • Számtani átlag • Bármely alapadathalmazból egyértelműen meghatározható, minden alapadatot felhasznál, mindig létezik • Érzékeny a szélsőséges értékekre nyesett átlag • Nem feltétlen tipikus érték
Kvantilisek • Eddig egyenlő osztályköz-hosszúságú gyakorisági sorokat képeztünk, amelyeknek eltért a relatív gyakorisága. • A kvantilisek olyan „osztópontok”, amelynek segítségével a növekvő sorrendbe állított adataink egyenlő gyakoriságú osztályokra bonthatóak • Jelölése: Xi/k • i-edik k-ad rendű kvantilis: az a szám, amelynél az összes előforduló ismérvérték i/k-ad része kisebb , (1-i/k)-ad része pedig nagyobb (i=1,..,k-1 és k>=2) • A rangsor si/k. tagja • Értéke Gazdaságstatisztika 2013 ősz
Ingadozásmutatók • Osztályozásuk: • Kitüntetett értéktől vett eltérés vagy egymástól vett eltérés • Abszolút vagy relatív • terjedelem • átlagos abszolút különbség • átlagos abszolút eltérés • szórás • relatív szórás
Átlagos abszolút különbség (G) • Az átlagos abszolút különbség a minden lehetséges módon párba állított ismérvértékek különbségeinek abszolút értékéből számított számtani átlag. • Azt mutatja meg, hogy az X ismérv értékei átlagosan mennyire különböznek egymástól. • Felhasználási területe: koncentrációelemzés Az 5 hallgató zh-n elért pontja átlagosan 25,8 ponttal tér el egymástól.
Átlagos abszolút eltérés (Δ) • Az átlagos abszolút eltérés az egyes ismérvértékek és a számtani átlag különbségeinek abszolút értékeiből számított számtani átlag. • Súlyozott formula: A gépleállások átlagosan 1,503-al térnek el az átlagtól.
Átlagos abszolút eltérés (Δ) Az egyes hozamadatok átlagosan 6,213%-kal térnek el az átlagtól.
Tapasztalati szórás • abszolút érték helyett négyzetre emelés és gyökvonás • A szórás az egyes Xi ismérvértékek átlagtól vett di eltéréseinek négyzetes átlaga. • Azt mutatja, hogy az egyes értékek átlagosan mennyire térnek el a számtani átlagtól. • Olyan átlagos hibaként is felfogható, amit akkor követünk el, ha minden adatot a számtani átlaggal helyettesítünk. • Csak akkor 0, ha minden ismérvérték egyenlő. • Érzékeny a kiugró értékekre.
Korrigált tapasztalati szórás • A szórás torzítatlan becsléssel • a becslés a szóban forgó paraméterérték körül ingadozzék. • a becslés (az illető statisztika) várható értéke éppen a megfelelő paraméterérték legyen. • a korrigált tapasztalati szórásnégyzet várható értéke az elméleti varianciával egyenlő, a tapasztalati szórásnégyzet az elméleti variancia torzított becslése
Tapasztalati szórás Az óránkénti leállások száma 1,779 db-bal tér el az átlagtól.
Tapasztalati szórás Az egyes hozamadatok átlagosan 6,77%-kal, illetve 6,806%-kal térnek el az átlagtól.
Relatív szórás • Különböző mértékegységű sorozatok szóródásának összehasonlítására • pozitív értékű ismérvekre! • az ismérvértékek átlagtól vett átlagos relatív eltérése • Nincs mértékegysége! • Minél kisebb az értéke, a számtani átlag annál jobb középérték
Alakmutatók • A gyakorisági eloszlás milyen mértékben tér el azún. normális eloszlástól • Eltérés lehet: • Bal ill. jobb oldali aszimmetria • Csúcsosság vagy lapultság
Pearson-féle mutatószám Normális eloszlás esetén értéke 0,263. Minél laposabb, annál nagyobb K értéke. Negatív P esetén jobboldali az aszimmetria (átlag<medián). Csúcsossági mutató