1 / 42

Többváltozós adatelemzés

Többváltozós adatelemzés. 2. előadás. Keresztábla elemzés. Más néven kontingencia tábla Két kategória változó együttes eloszlását mutataja Általában nominális vagy ordinális mérési szintű változókra használjuk. Kereszttábla. Kereszttábla. Kereszttábla. Mit vizsgálunk?.

ossie
Download Presentation

Többváltozós adatelemzés

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Többváltozós adatelemzés 2. előadás

  2. Keresztábla elemzés • Más néven kontingencia tábla • Két kategória változó együttes eloszlását mutataja • Általában nominális vagy ordinális mérési szintű változókra használjuk

  3. Kereszttábla

  4. Kereszttábla

  5. Kereszttábla

  6. Mit vizsgálunk? • Független-e a két változó eloszlása, vagy valamilyen (a véletlen ingadozáson túlmutató) összefüggés van a változók között. • Pl.: akik tornateremmel rendelkeznek, nagyobb valószínűséggel rendelkeznek könyvtárral is. • Pl.: vannak olyan fenntartók, akik nagyobb gondot fordítanak (több forrás áll rendelkezésükre) a tornateremre.

  7. Hogy vizsgáljuk • Amennyiben a változók függetlenek, akkor az együttes bekövetkezési valószínűség a parciális bekövetkezési valószínűségek szorzata.

  8. Független vs. tényleges

  9. Függetlenség tesztelése • Pearson: • Likelihood arány:

  10. Függetlenség tesztelése

  11. A függetlenség nemcsak az arányoktól függ, hanem a mintanagyságtól is

  12. Asszociáció szorosságának mérése • Χ2 alapú mutatószámok: • Phi • Cramer V • Kontingencia együttható

  13. Asszociáció szorossága

  14. Asszociáció szorossága • A mutatók értékei 0 és 1 között vannak (elméleti határ) • 0, ha nincs kapcsolat a két változó között (függetlenség) • 1, ha determinisztikus kapcsolat van a két változó között

  15. Az asszociáció mutató számai nem függnek a csoport méretétől

  16. Asszociáció szorosságának mérése • PRE (Proportional Reduction of Errors) alapú mutatószámok • Guttman féle lambda • Azt vizsgálja, hogy mi a legjobb becslés különböző kategóriák esetén, és ezáltal mennyivel csökkenthető a bizonytalanság

  17. Guttman féle lambda

  18. Guttman féle lambda • (30-19)+(69-46)+(135-43)+ (343-138)+(171-57)+(70-28)=487 lambda=1-487/(818-239)=1-0,841=0,159 • A besorolási bizonytalanság 16%-kal csökkenthető, ha figyelembe vesszük a tanulók szorgalmát • A mutató értéke 0 és 1 között van: • 0: nem tudunk semmit javítani a besoroláson • 1: a besorolás tökéletes (determinisztikus kapcsolat)

  19. Guttman féle lambda

  20. Guttman féle lambda

  21. Guttman féle lambda • Hátránya, hogy ha valamelyik kategória gyakrabban fordul elő a többinél, akkor a lamba-ra 0 adódik a szignifikáns kapcsolat esetén is.

  22. Associáció mérése • További PRE alapú mutatószámok: • Goodman-Kruskal féle tau • ‘Uncertainty coefficient’ • Nemcsak a leggyakoribb kategóriaértéket veszik figyelembe, hanem a többit is.

  23. PRE alapú mutatószámok

  24. Ordinális változók esetén a kapcsolat szorossága • Ordinális változók esetén nemcsak a kacsolat szorosságát lehet meghatározni, hanem annak irányát is (nagyobb értékhez inkább nagyobb érték tartozik, vagy épp fordítva)

  25. Kapcsolat szorossága • Goodman Kruskal féle gamma: • Hány olyan pár van az adatbázisban, ahol az első változó értékéhez a második változó nagyobb értéke társul • Hány olyan pár van, amikor az első változó nagyobb értékéhez a második változó kisebb értéke térsul • Hány olyan eset áll fenn, ami egyik fenti kategóriába sem fér bele (ún. csomósodás)

  26. Goodman Kruskal féle gamma Pozitív irány: 1-3 1-4 2-3 2-4 Negatív irány: 2-5 3-5 4-5 Csomósodás:1-2 1-5 3-4

  27. Goodman Kruskal féle gamma • Az értékek kereszttáblából is számolhatók: Pozitív irány: 19*(46+43+56+...+28)+17*(43+56+11+…+28)+ +…+51*28 Negatív irány 17*(7+2+2+0+0)+15*(7+46+2+…+0)+…+ +20*(0+0+1+3+14)

  28. Goodman Kruskal féle gamma • Pozitív irányok (concordant) számát jelölje P • Negativ irányok (disconcordant) számát jelölje Q • gamma=(P-Q)/(P+Q)

  29. Goodman Kruskal féle gamma • A mutató értéke -1 és 1 között van. Amennyiben a két változó kapcsolatában nem mutatható ki összefüggés a mutató értéke 0. Ha kimutatható és a nagyobb értékhez nagyobb tartozik, akkor pozitív, ha nagyobb értékhez kisebb tartozik negatív a mutató értéke

  30. Probléma nagysága ötfokú skálán: A tanulók iskolai magatartása

  31. További mutatók • Abban különböznek, hogy hogyan kezelik a ‘csomósodást’ • Sommers féle d • Kendall féle tau-b • Kendall féle tau-c

  32. További mutatók

  33. Nominális vs. ordinális?

  34. Nominális vs. ordinális?

  35. Vélemények egyezősége • Négyzetes táblákra alkalmazható csak, ahol a két vizsgált változó ugyanazokat az értékeket veszi fel • Azt vizsgálja csak, hogy a két változó ugyanazokat az értékeket veszi-e fel vagy sem, azaz csak a fődiagonálisban lévő cellákat vizsgálja • Tipikus alkalmazása, ha egy kisérlet előtt és után is megkérdezzük a vizsgált személy véleményét, vagy ha két különböző személy (pl házaspár) véleményét kérdezzük ugyanarról a dologról

  36. Vélemények egyezősége

  37. Kappa • Kappa értéke: • 0, ha az egyezőség csak a véletlennek tudható be, • pozitív, ha a vélemények egyeznek (1, ha tökéletes egyezőség van), • negatív, ha nem egyeznek (legkisebb értéke nem -1) • Inkább csak tesztelésre alkalmas, összehasonlításra nem

  38. Miben különbözik a függetlenség tesztelésétől?

  39. Miben különbözik a függetlenség tesztelésétől?

  40. Szimmetrikusság tesztelése • Alapevetően nem a függetlenséget teszteljük, hanem egyfajta változatlanságot • Először gyógyszerkisérleteknél alkalmazták. Feljegyezték, hogy egy adott betegség a vizsgált személynél megállapítható-e vagy sem, utána kapott kezelték egy vegyülettel és később megint megvizsgálták, hogy a betegség nála kimutatható-e vagy sem. A kérdés az, hogy a gyógyszernek van-e hatása vagy nincs.

  41. Szimmetrikusság tesztelése • Lehet, hogy alapvetően nem független a két időpontban diagnosztizált betegség, mert például a páciens védettséget szerez. Tehát a χ2 teszt nem ad kielégítő bizonyítékot a gyógyszer hatékonyságára

  42. Szimmetrikusság tesztelése

More Related