470 likes | 584 Views
StatSoft Statistica for Windows kezelése: korreláció és regresszióanalízis. Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék. Vizsgálataink egyik gyakori kérdése, hogy van-e összefüggés a kapott eredmények között?
E N D
StatSoft Statistica for Windows kezelése: korreláció és regresszióanalízis Ozsváth KárolyTF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék
Vizsgálataink egyik gyakori kérdése, hogy van-e összefüggés a kapott eredmények között? • A változók közötti összefüggések kimutatására és elemzésére a korreláció számítás szolgál. • Korrelációs koefficiens (r): két sztochasztikus változó kapcsolatának mérőszáma.
Korrelációs koefficiens értéke 0-1 között változhat, előjele negatív és pozitív egyaránt lehet. (Értékkészlete tehát -1 és +1 közötti.) • Minél nagyobb az (abszolút) érték, annál szorosabb az összefüggés. Az r=0 körüli értékek függetlenséget jelentenek. Az r=±1 függvénykapcsolatot jelent. • A pozitív együtthatók azonos irányú kapcsolatot jelentenek: egyik változó nagyobb értékei a másik változó nagyobb értékeivel járnak együtt. A negatív korreláció ellentétes kapcsolatot jelent: az egyik változó nagyobb értékei a másik változó kisebb értékeivel járnak együtt. • A korrelációs együttható szignifikanciáját külön meg kell vizsgálni. A kritikus értékek (n-2) szabadságfok mellett kerülnek meghatározásra. A nullhipotézis szerint nincs összefüggés a két változó között. • Magas elemszámok esetén alacsony korrelációk is szignifikánsak, míg kis elemszámú mintáknál szoros korrelációk sem feltétlenül érik el a kritikus értékeket. A statisztikai programok a szignifikancia szinteket pontosan jelzik. • A korrelációszámítás „folytatása” a regresszió, regresszióanalízis (RA, MRA, MVRA): az összefüggést leginkább jellemző függvény meghatározása és elemzése, a függvény („görbe”) szerinti becslés „jóságának”, pontosságának analízise.
Függő (y) és független (x) változó/k nem cserélhető/k fel! A függvény képlete szerinti értékek a „jósolt értékek” (y). • A regressziós kapcsolat (illetve a függvények, görbék) fő típusai: • lineáris • polinomiális (n-ed fokú) • parabolikus (másodfokú) • logaritmikus • exponenciális • hiperbolikus • hatvány
Fábián Gy. – Zsidegh M.: A testnevelési és sporttudományos kutatások módszertana, 117-128., 158-184. p. • Fájl: ergo.sta
Többszörös regresszióanalízis (MRA) – „standard” és lépésenkénti („stepwise”) módszerrel • Fájl: eufit2004 ccc.sta • 1 függő változó (összpontszám) • 9 független változó (motoros tesztek) • Cél: az összpontszám becslésére szolgáló regressziós egyenlet meghatározása
Válasszuk a módszerek közül a görgetősávnál valamelyik stepwise változatot. Célszerű az „előre lépésenkénti” módszert választani.
Az eredmények megjelenítéséhez választhatjuk a „csak összegzés”, vagy a „lépésről lépésre” lehetőségeket. (Utóbbi esetben a következő képernyőkön az „OK” gomb helyett a „Next” jelenik meg az utolsó lépésig.)
A független változók a regressziós modellbe történő bevonás „erősorrendjében” szerepelnek. A lépések során az R egyre nő, de csökkenő mértékben. A bevonáshoz/visszavonáshoz figyelembe vett F-értékek elvileg csökkenő tendenciát szoktak követni, ami jelen esetben nem teljesen következetes.
Jelen esetben a standard és a lépésenkénti MRA azonos eredményt adott, csak a stepwise változatnál a bevonás sorrendjében szerepelnek a független változók. • A lépésenkénti eljárás lényegének megértéséhez nézzünk egy másik példát ugyanezen adatbázissal: ezúttal az állóképességi ingafutást tekintsük függő változónak.
Ha a standard változatot alkalmazzuk, akkor R=0,5015 mellett, F=1,22 p<0,3235 nem szignifikáns eredményt kapunk, a jósolt érték 22,571 hibája mellett. (Azaz ez a regressziós modell nem használható.)
Ha viszont a lépésenkénti többszörös regresszióanalízist választjuk, akkor csak 3 független változó kerül be a modellbe R=0,4849 mellett, és…
… a regresszió fennállására vonatkozó F=3,48 p<0,0262 szignifikáns eredményt kapunk. A jósolt érték hibája ezúttal 21. A gyakorlatban ez a modell sem használható, túl nagy a modell hibája. A lépésenkénti MRA azonban a standard változathoz képest egyszerűbb és szignifikáns eredményt adott, majdnem azonos többszörös korreláció (R) mellett. (A korrigált determinációs együttható itt R2=0,1676 szemben az előző 0,045-tel.)