220 likes | 570 Views
Uurimismeetodid II. Magistriõpe Lektor: Piret Luik. Statistiline sõltuvus (dependence). Sõltuvus tavaelus Funktsionaalne sõltuvus Statistiline sõltuvus – kui ühe tunnuse käitumine sõltub teise tunnuse väärtustest. Statistilise sõltuvuse uurimine.
E N D
Uurimismeetodid II Magistriõpe Lektor: Piret Luik
Statistiline sõltuvus (dependence) • Sõltuvus tavaelus • Funktsionaalne sõltuvus • Statistiline sõltuvus – kui ühe tunnuse käitumine sõltub teise tunnuse väärtustest
Statistilise sõltuvuse uurimine • Objektid peaks olema statistiliselt sõltumatud • Hüpoteesideks leida tunnustevahelisi sõltuvusi • Prognoosimiseks peavad tunnused olema statistiliselt sõltuvad
Statistilise sõltuvuse mõõtmine • Kui tugev on statistiline sõltuvus • Kas see sõltuvus kehtib ka üldkogumis (on statistiliselt oluline) • Täielik vastastikune sõltuvus • Täielik ühepoolne sõltuvus
Statistilise seose kordaja • Väärtus 0 ja 1 vahel • Sõltumatute tunnuste korral 0 • Täielikult sõltuvate tunnuste korral 1 • Tugevamale seosele vastab suurem seosekordaja väärtus
Seose näitajad • Tunnuste vahelise seose näitajad (Crameri V, nelikkordaja) • Monotoonse seose näitajad (Spearmani astakkorrelatsioon (rankcorrelation), Goodman-Kruskali gamma kordaja, Kendalli t, lineaar-korrelatsioon (Pearson))
Monotoonse seose näitajad • Vahemikus miinus ühest üheni. • Kui seosekordaja on positiivne, siis kaks suurust on samasuunaliselt muutuvad. • Kui 0, siis need suurused pole omavahel seotud. • Kui negatiivne, siis on seos tugev, kuid vastupidine. • Mida suurem on seosekordaja absoluut-väärtus, seda tugevam on tunnuste vaheline seos.
Üheks tunnuste vahelise seose näitajaks on ka kovariatsioon (covariation).
Lineaarkorrelatsioon (Pearson’s correlation) Standardiseeritud seose näitaja (ei sõltu mõõtühikust). Maatriks sümmeetriline.
Korrelatiivse seose uurimise aspektid • Seose rangus ehk tugevus • Seose kuju • Seose suund
Regressioonanalüüs (Regression) Regressioonanalüüs on võrrand, mis ennustab kõige suurema tõenäosusega ühe muutuja väärtust (funktsioontunnus) teiste väärtuste kaudu (argumenttunnused).
Korrelatsiooni põhjal otsustada • Kui argumenttunnus pole seotud funktsioontunnusega, ei saa väljastada regressioonivõrrandit (prognoosida). • Kui taustatunnused pole seotud teiste tunnustega, võib need kõrvale jätta. • Mitte võtta võrrandisse omavahel tugevalt seotud argumenttunnuseid. • Kui võimalik, siis võtta võrrandisse nii positiivselt, kui negatiivselt seotud argumenttunnuseid.
Sotsiaalsete nähtuste vaheliste seoste uurimisel kasutatakse: • sirge ehk lineaarne funktsioon (lineaarne korrelatsioon on oluline) • hüperbool • teist-järku parabool • eksponentfunktsioon • astmefunktsioon
Regressioonvõrrandi interpreteerimine PTS=54.6-0,180X141 + 5.806X241 –0.458X2511 X141alammenüüs olevate terminite protsent X241näidete olemasolu X2511kolmemõõtmeliste jooniste arv
Regressioonivõrrandi valik: • regressioonivõrrand oleks lihtsalt arvutatav • ja prognoosiks suure tõenäosusega funktsioontunnuse • õige valik muutujatest