300 likes | 466 Views
STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos. TÉMAKÖRÖK Gyakorisági sorok fajtái Kvantilisek Középértékek Szóródás. Empírikus eloszlás: A megfigyelések (kísérletek) eredményeként kapott adatok eloszlása. (elméleti eloszlás – valószínűségszámítás).
E N D
STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos
TÉMAKÖRÖK • Gyakorisági sorok fajtái • Kvantilisek • Középértékek • Szóródás
Empírikus eloszlás: A megfigyelések (kísérletek) eredményeként kapott adatok eloszlása. (elméleti eloszlás – valószínűségszámítás) A számszerű adatok rendezési módja: • Gyakorisági sor készítése • Kvantilis értékek megadása
Gyakorisági sor: Valamely sokaságnak egy mennyiségi ismérv szerinti csoportosítása Tipikus eset: osztályközös gyakorisági sor (kiosztott példa)
A gyakorisági sorból képezhető további • mennyiségi sortípusok: • Értékösszeg sor • Relatív gyakorisági és relatív értékösszegsor • Kumulált (halmozott) gyakorisági és értékösszeg sorok • Kumulált relatív gyakorisági és relatív értékösszegsor • (kiosztott példa)
Kvantilisek: Az ismérvértékek elhelyezkedésének tömör leírását adják. Elnevezésük: Medián (Me) ha két részre osztjuk Kvartilis (Qj) ha négy részre osztjuk Kvintilis (Kj) ha öt részre osztjuk Decilis (Dj) ha tíz részre osztjuk Percentilis (Pj) ha száz részre osztjuk
Meghatározásuk: Rangsort készítünk (növekvő sorrend) Meghatározzuk a kvantilis értékek sorszámát (osztópontját). Ahol: n= az adatok száma k= az egyenlő részek száma j= 1,2,…k-1 az adott kvantilis értékeken belüli sorszám
A rangsorban az sj sorszámhoz tartozó ismérvértékek megkeresése.
A KIOSZTOTT PÉLDA ALAPJÁN: Medián: Kvartilisek: (Qj) Me=201 ezer Ft Q1=159 ezer forint Q2= 201 ezer forint Q3= 269 ezer forint
Decilis: 102+0,6 (108-102)=105,6 D2=140+0,2(142-140)=140,4
xmin xmax Me Q1 Q3 Box-and-wishkers ábra: (az adatok középső, 50%-át „dobozba” zárva tünteti fel)
Q1(159) Me Q3(269) Xmin=54 Xmax=490 50 100 150 200 250 300 350 400 450 500 A vizsgált jövedelmek Box-and wishkers ábrája A családok havi jövedelme 54 ezer és 490 ezer Ft között ingadozik. A családok középső 50%-a 159 ezer és 269 ezer Ft között jövedelemmel rendelkezik.
KÖZÉPÉRTÉKEK A mennyiségi ismérv megfigyelt értékeit • a centrális tendenciát - egyetlen számmal mérik. A jellemző közös vonást emelik ki. Értékelésükhöz elengedhetetlen a szóródás ismerete, amellyel az eltérő sajátosságokat lehet kiemelni.
KÖZÉPÉRTÉKEK FAJTÁI ÁtlagokHelyzeti középértékek számtani átlag Módusz (Mo) mértani átlag Medián (Me) (geometriai) harmonikus átlag négyzetes átlag
a) Számtani átlag: Egyszerű: (tehát: ha a megfigyelt értékek helyébe a számtani átlagot tesszük, ezek kösszege egyenlő az eredeti értékek összegével.) Súlyozott:
Érzékeny a kiugró értékekre (outlierek) A súlyok lehetnek a relatív gyakoriságok (megoszlási viszonyszámok) is. A súlyozott számtani átlag nagysága két tényezőtől függ: • Átlagolandó értékek abszolút nagyságától és a • Súlyok arányaitól
ezer Ft ezer Ft Számítás a kiosztott példa alapján, egyedi adatokból: Gyakorisági sorból:
b) Mértani átlag: Egyszerű: Súlyozott: Ha a megfigyelt értékek helyébe a mértani átlagot tesszük, azok szorzata megegyezik az eredeti adatok szorzatával. Akkor használjuk, ha az értékek szorzata értelmezhető.
c) Harmonikus átlag: Egyszerű: Súlyozott: d) Négyzetes átlag: Egyszerű Súlyozott:
Átlagok nagyságrendje: Leggyakoribb a számtani átlag, használata
HELYZETI KÖZÉPÉRTÉKEK Módusz (Mo) A leggyakrabban előforduló, a „legdivatosabb – la mode”- érték Medián (Me) A ténylegesen középen lévő érték – ugyanannyi kisebb mint nagyobb érték található nála. Diszkrét ismérveknél egyszerű a meghatározása. Osztályközök esetén becslést kell végezni.
ezer Ft ezer Ft Számítás a kiosztott példa alapján:
SZÓRÓDÁS • Az értékek különbözőségét, változékonyságát • szóródásnak nevezzük. • Mérőszámai: • a szóródás terjedelme (range) T • interkvartilis terjedelem (IQT) • átlagos abszolút eltérés (δ) • szórás (σ) • relatív szórás (v)
Osztályköz felső hatásánál kisebb jövedelem összege jövedelem családok száma Relatív gyakoriság Osztály közép Gyakori- ság Családok száma Jövedelem összege tényleges Becsült osztályköz 95 család havi jövedelmi adatai (1000 Ft) 2007. február 15-én
A struktúraváltozásról: A megoszlási és dinamikus viszonyszámok alakulása – a közöttük lévő összefüggés. Példa: Egy település lakosságának száma és megoszlása iskolai végzettség szerint 2000-ben és 2006-ban:
Töltse ki tetszőleges számokkal az alábbi táblázatokat: Egy vállalkozás adatai:
Szórás a leggyakrabban használt szóródási mérőszám. Kiszámítása: egyszerű:súlyozott: Azt mutatja, hogy az egyes (egyedi) értékek mennyivel térnek el átlagosan a számtani átlagtól, a centrális értéktől.