1 / 32

Többváltozós adatelemzés

Többváltozós adatelemzés. 1. előadás. A tantárgy előadója. Ágoston Kolos Csaba Egyetemi adjunktus Operációkutatás Tanszék Operációkutatás, Aktuárius szakirány tárgyai, Pénzügyi adatok elemzése. A tantárgy célja. Elsajátítani a többváltozós adatelemzés legismertebb módszereit

calais
Download Presentation

Többváltozós adatelemzés

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Többváltozós adatelemzés 1. előadás

  2. A tantárgy előadója • Ágoston Kolos Csaba • Egyetemi adjunktus • Operációkutatás Tanszék • Operációkutatás, Aktuárius szakirány tárgyai, Pénzügyi adatok elemzése

  3. A tantárgy célja • Elsajátítani a többváltozós adatelemzés legismertebb módszereit • Megismerni és készség szinten használni az SPSS programcsomagot

  4. Számonkérés • Minimumteszt: géptermi vizsga 30 perc időtartamban. A félévben tanultakhoz kapcsolódóan 7 kérdés. A kérdésekre papíron kell válaszolni. Aki a 7 kérdésből 5-re helyes választ adott mehet vizsgázni. A minimumteszt eredménye nem számít be a vizsga eredményébe. Az Operációkutatás Tanszék honlapján található korábbi minimumteszt (más tárgyból).

  5. Számonkérés • Szóbeli vizsga: 15-20 perc időtartamban. A hallgatónak egy általa választott adatbázison többváltozós módszerekkel egy elemzést kell elvégeznie. Ennek az eredményeit prezentálja a szóbeli vizsgán. A vizsgához szempontokat az Operációkutatás Tanszék honlapján talál.

  6. Mérési szintek • Nominális: a változó értékei fel vannak sorolva, semmilyen viszony nincs köztük. Pl.:nem, Magyarország megyéi. • Ordinális: a változó értékei rangsort jelentenek, de nem tudunk távolságot értelmezni. Pl.: iskolai végzettség, érdemjegyek. Nem mondhatjuk, hogy a ‘8 általános’ és ‘szakmunkás’ között ugyanakkora a különbség, mint a ‘főiskola’ és ‘egyetem’ között.

  7. Mérési szintek - 2 • Intervallum skála: a változó értékei között tudok távolságot mérni, de nem tudok arányt értelmezni (nincs természetes 0 pont). Pl.: hőmérséklet. • Arány skála: a változó értéke esetén tudok arányt értelmezni. Pl. jövedelem, életkor. Értelmes azt mondani, hogy Antal annyival keres többet Bélánál, amennyivel Béla Csillánál. Értelmes az is, hogy Antal kétszer annyit keres, mint Béla.

  8. Mérési szintek - 3 • Az intervallum skála (de nem arány skála) ritkán fordul elő. Ezt a programcsomagok (az SPSS is) egy kategóriának kezeli. • Az intervallum- vagy arány skálán mért változókkal több féle elemzést lehet elvégezni. • A nominális és ordinális mérési szinten mért változók jellemzően kategória változók, a skálán mért változók jellemzően folytonos változók.

  9. Mutatószámok • Nominális változók esetén valószínűség eloszlást tudunk csak készíteni. Ilyen változók esetén csak módusz létezik.

  10. Adatbázis • Az előadásokon használt adatbázis egy a magyar iskolákban elvégzett kutatásból származik. A kutatás részletei és az adatbázis letölthető az Internetről: http://www.oki.hu/oldal.php?tipus=cikk&kod=adatbazisok-valaszol

  11. Nominális változók

  12. Mutatószámok - 2 • Ordinális változók esetén a módusz mellett értelmezni lehet a mediánt is, továbbá kvartiliseket, deciliseket, percentiliseket is.

  13. Ordinális változók

  14. Mutatószámok • Legalább intervallum skálán mért változók esetén már távolságot tudunk értelmezni, a változó jellemzésére alkalmas mutatószámok száma megnövekszik: átlag, variancia, szórás, ferdeség, csúcsosság, stb ….

  15. Születés éve

  16. Helyben lakók aránya az 1-4 évfolyamon

  17. Működési kiadás összesen2001-ben

  18. Mutatószámok

  19. Az átlag érzékeny a szélső értékekre A működési költségeket tartalmazó változóból vett 3 különböző 10%-os minta

  20. Az átlag érzékeny a szélső értékekre A működési költségeket tartalmazó változóból vett 3 különböző 10%-os minta

  21. Az eloszlás ferdesége • Több mutatószám létezik, mi az ún. ‘skewness’ mutatót használjuk: • Ha mintából becsüljük: • Ahol a korrigált tapasztalati szórás

  22. Az eloszlás ferdesége • Pozitív és negatív ferdeségről beszélünk. • Szimmetrikus eloszlások esetén a ferdeség értéke 0.

  23. Eloszlás csúcsossága • Több mutatószám létezik, mi a kurtózist használjuk: • Ha mintából becsüljük:

  24. Az eloszlás csúcsossága • A kurtózis mutató értéke csak pozítív lehet, normális eloszlás esetén 3 az értéke. • A SPSS az ún. kurtózis meghaladás értékét mutatja (de kurtózisnak hívja), ami a kurtózisból levonja a 3 értéket, így lehet negatív is.

  25. Az eloszlás csúcsossága • A normális eloszlásnál csúcsosabb eloszlás két dolgot mutathat: • Az átlag környékén több érték található, mint normális eloszlás esetén vagy • Az eloszlás szélein több megfigyelés található, mint normális eloszlás esetén

  26. 3 elszlás csúcsossága • Sztenderd normális • (a,b) intervallumon egyenletes • Két szembefordított exponenciális

  27. 3 eloszlás csúcsossága

  28. 3 eloszlás csúcsossága

  29. Változók transzformálása • Amennyiben valamelyik változó eloszlása jelentősen eltér a normális eloszlástól, és/vagy nagy egyedi kiugró értékek vannak meg lehet próbálni valamilyen transzformációval közelebb hozni a normális eloszláshoz • Legáltalánosabb transzformálás a logaritmálás. Akkor célszerű alkalmazni, amikor a változóra inkább valamilyen arányszerű változás a jellemző

  30. Működési költség illetve annak logaritmáltja

  31. Működési költség illetve annak logaritmáltja

  32. Működési költség illetve annak logaritmáltja

More Related