1 / 42

Gazdaságstatisztika

Gazdaságstatisztika. LEÍRÓ STATISZTIKA I I. 3. előadás 2013. szeptember 18. Adatok csoportosítása, osztályozása. A mennyiségi sorok grafikus ábrázolásának alapját a gyakorisági táblázat készítése jelenti. Osztályba sorolás (folytonos adatok és nagyszámú diszkrét megfigyelés esetén);

amy-downs
Download Presentation

Gazdaságstatisztika

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Gazdaságstatisztika LEÍRÓ STATISZTIKAII. 3. előadás 2013. szeptember 18.

  2. Adatok csoportosítása, osztályozása • A mennyiségi sorok grafikus ábrázolásának alapját a gyakorisági táblázat készítése jelenti. • Osztályba sorolás (folytonos adatok és nagyszámú diszkrét megfigyelés esetén); • gyakoriságok (fi) megállapítása; • relatív gyakoriságok (gi) megállapítása • összegzett (kumulált) gyakoriságok (fi’), illetve összegzett relatív gyakoriságok (gi’) megállapítása; • gyakorisági táblázat készítése (fi , gi , fi’ , gi’ adataiból); • gyakorisági (relatív gyakorisági), illetve összegzett gyakorisági (relatív gyakorisági) hisztogramok (folytonos adatok esetén a poligon és az ogiva) felvétele (tapasztalati eloszlások elkészítése); • grafikus ábrázolás

  3. Példa – kevés számú diszkrét adat (24 óra alatti gépleállások

  4. Relatív gyakoriságok gyakoriságok 0,2 5 0,16 4 0,12 3 2 0,08 1 0,04 0 1 2 3 4 5 6 Leállások száma Példa – kevés számú diszkrét adat Adatok ábrázolása: PÁLCIKA DIAGRAM

  5. 1 Kumulált relatív gyakoriságok 0,5 Leállások száma 0 4 1 2 5 3 6 Példa – kevés számú diszkrét adat Kumulált relatív gyakoriság ábrázolása:

  6. Példa – folytonos adat (Bux index)

  7. Példa – nagy számú folytonos adat GYAKORISÁGI HISZTOGRAM (tapasztalati sűrűségfüggvény) Gyakoriság vonaldiagramja

  8. Példa – nagy számú folytonos adat Gyakorisági görbe

  9. Példa – nagy számú folytonos adat Ogiva KUMULÁLT RELATÍV GYAKORISÁG VONALDIAGRAMJA (tapasztalati eloszlásfüggvény)

  10. Középértékek Helyzeti Számított Módusz Számtani átlag Mértani átlag Medián Harmonikus átlag Négyzetes átlag Tapasztalati eloszlásokjellegzetességei Középérték-mutatók: helyzeti és számított Ingadozásmutatók: abszolút és relatív Alakmutatók • Középérték elvárások: • Közepes helyzetűek • Tipikusak • Egyértelműen meghatározhatóak • Lehetőleg könnyen értelmezhetőek

  11. Medián • Helyzeti középérték – valódi középérték, a rangsor közepén található: az az érték, amelynél az előforduló értékek fele kisebb, fele pedig nagyobb • Páratlan számú adatnál a középső • Páros számú adatnál a két középső érték számtani átlaga • Mindig meghatározható • Érzéketlen a szélsőértékekre, és nem függ a többi ismérvértéktől sem • Sok egyforma ismérvérték esetén azonban nem tanácsos használni ha 1 0 6 17 23 13 3 2 19 1 0 6 17 23 13 3 2 0 1 2 3 6 13 17 19 23 0 1 2 3 6 13 17 23 4,5

  12. Medián – diszkrét példa Páros számú adat esetén a rangsor két középső számának átlaga: a 12. és 13. adat értéke is 2, így a medián értéke 2

  13. Medián – folytonos példa Páratlan számú adat esetén a rangsor középső tagja: ez a rangsor 50. tagja (ennél 49 kisebb és 49 nagyobb érték fordul elő)

  14. Medián becslése A mediánt tartalmazó osztály bal végpontja. me annak a legelső osztályköznek a sorszáma, amelyre igaz, hogy A mediánt tartalmazó osztály hossza.

  15. Módusz • Helyzeti középérték – tipikus • Diszkrét ismérv esetén a leggyakrabban előforduló ismérvérték • Folytonos ismérv esetén pedig a gyakorisági görbe maximumhelye • Nem mindig határozható meg egyértelműen, nem mindig létezik • Érzéketlen a szélsőértékekre, nem függ a többi ismérvértéktől sem • Becslése bizonytalan • Nyers módusz

  16. Módusz – diszkrét példa A gyakorisági sorban egynél több kiugró gyakoriság fordul elő. Nem határozható meg egyértelműen, célszerű más középérték mutatót is számítani.

  17. Módusz – folytonos példa Folytonos esetben a legnagyobb gyakoriságú osztály tartalmazza.

  18. Módusz becslése moa legnagyobb gyakoriságú osztály(ok) sorszáma A móduszt tartalmazó osztály bal végpontja. A móduszt tartalmazó osztály hossza.

  19. Számtani átlag • Az a szám, amellyel az átlagolandó számértékeket helyettesítve azok összege változatlan marad • Leggyakrabban használt középérték • Meghatározható gyakorisági sorból is a gyakoriságokkal súlyozva • Számított középérték-mutató • Bármely alapadathalmazból egyértelműen meghatározható • Minden alapadatot felhasznál • Érzékeny a szélsőértékekre • Nyesett átlag min. ,ha

  20. Számtani átlag –diszkrét példa

  21. Számtani átlag – folytonos példa

  22. Számtani átlag – folytonos példa

  23. Harmonikus átlag • A harmonikus átlag az a szám, amellyel az átlagolandó értékeket helyettesítve azok reciprokainak összege változatlan marad. Mértani átlag • A mértani átlag az a szám, amellyel az átlagolandó értékeket helyettesítve azok szorzata változatlan marad.

  24. Négyzetes átlag • Az a szám, amellyel az átlagolandó értékeket helyettesítve, azok négyzetösszege változatlan marad • Tipikus alkalmazási területe a szórásszámítás Választás a középértékek között

  25. Választás a középértékek között • Módusz, medián, számtani átlag? • Melyiket használjuk? • Egyértelműen meghatározható-e? • Az összes rendelkezésre álló adattól függ-e vagy sem? • Mennyire érzékeny a szélsőségesen nagy vagy kicsi értékekre? • Mekkora és milyen módon értelmezhető hibával képes helyettesíteni az alapadatokat?

  26. Választás a középértékek között • Medián • Egyértelműen meghatározható, mindig létezik • Ha sok az egyforma ismérvérték, akkor nem tanácsos használni • Nem függ sem az összes értéktől, sem a szélsőséges értékektől • Módusz • Nem mindig határozható meg egyértelműen, nem is mindig létezik • Becslése bizonytalan (függ az osztályok kialakításától) • Nem függ sem az összes értéktől, sem a szélsőséges értékektől • Számtani átlag • Bármely alapadathalmazból egyértelműen meghatározható, minden alapadatot felhasznál, mindig létezik • Érzékeny a szélsőséges értékekre  nyesett átlag • Nem feltétlen tipikus érték

  27. Kvantilisek • Eddig egyenlő osztályköz-hosszúságú gyakorisági sorokat képeztünk, amelyeknek eltért a relatív gyakorisága. • A kvantilisek olyan „osztópontok”, amelynek segítségével a növekvő sorrendbe állított adataink egyenlő gyakoriságú osztályokra bonthatóak • Jelölése: Xi/k • i-edik k-ad rendű kvantilis: az a szám, amelynél az összes előforduló ismérvérték i/k-ad része kisebb , (1-i/k)-ad része pedig nagyobb (i=1,..,k-1 és k>=2) • A rangsor si/k. tagja • Értéke Gazdaságstatisztika 2013 ősz

  28. A legfontosabb kvantilisek

  29. Kvantilisek meghatározása – folytonos példa

  30. Ingadozásmutatók • Osztályozásuk: • Kitüntetett értéktől vett eltérés vagy egymástól vett eltérés • Abszolút vagy relatív • terjedelem • átlagos abszolút különbség • átlagos abszolút eltérés • szórás • relatív szórás

  31. Terjedelemmutatók

  32. Átlagos abszolút különbség (G) • Az átlagos abszolút különbség a minden lehetséges módon párba állított ismérvértékek különbségeinek abszolút értékéből számított számtani átlag. • Azt mutatja meg, hogy az X ismérv értékei átlagosan mennyire különböznek egymástól. • Felhasználási területe: koncentrációelemzés Az 5 hallgató zh-n elért pontja átlagosan 25,8 ponttal tér el egymástól.

  33. Átlagos abszolút eltérés (Δ) • Az átlagos abszolút eltérés az egyes ismérvértékek és a számtani átlag különbségeinek abszolút értékeiből számított számtani átlag. • Súlyozott formula: A gépleállások átlagosan 1,503-al térnek el az átlagtól.

  34. Átlagos abszolút eltérés (Δ) Az egyes hozamadatok átlagosan 6,213%-kal térnek el az átlagtól.

  35. Tapasztalati szórás • abszolút érték helyett négyzetre emelés és gyökvonás • A szórás az egyes Xi ismérvértékek átlagtól vett di eltéréseinek négyzetes átlaga. • Azt mutatja, hogy az egyes értékek átlagosan mennyire térnek el a számtani átlagtól. • Olyan átlagos hibaként is felfogható, amit akkor követünk el, ha minden adatot a számtani átlaggal helyettesítünk. • Csak akkor 0, ha minden ismérvérték egyenlő. • Érzékeny a kiugró értékekre.

  36. Korrigált tapasztalati szórás • A szórás torzítatlan becsléssel • a becslés a szóban forgó paraméterérték körül ingadozzék. • a becslés (az illető statisztika) várható értéke éppen a megfelelő paraméterérték legyen. • a korrigált tapasztalati szórásnégyzet várható értéke az elméleti varianciával egyenlő, a tapasztalati szórásnégyzet az elméleti variancia torzított becslése

  37. Tapasztalati szórás Az óránkénti leállások száma 1,779 db-bal tér el az átlagtól.

  38. Tapasztalati szórás Az egyes hozamadatok átlagosan 6,77%-kal, illetve 6,806%-kal térnek el az átlagtól.

  39. Tapasztalati szórás

  40. Relatív szórás • Különböző mértékegységű sorozatok szóródásának összehasonlítására • pozitív értékű ismérvekre! • az ismérvértékek átlagtól vett átlagos relatív eltérése • Nincs mértékegysége! • Minél kisebb az értéke, a számtani átlag annál jobb középérték

  41. Alakmutatók • A gyakorisági eloszlás milyen mértékben tér el azún. normális eloszlástól • Eltérés lehet: • Bal ill. jobb oldali aszimmetria • Csúcsosság vagy lapultság

  42. Pearson-féle mutatószám Normális eloszlás esetén értéke 0,263. Minél laposabb, annál nagyobb K értéke. Negatív P esetén jobboldali az aszimmetria (átlag<medián). Csúcsossági mutató

More Related