260 likes | 643 Views
Ryšio nustatymas. Skaitmeniniai duomenys (koreliacija, regresija) Kategoriniai duomenys. Koreliacija. Naudojama norint parodyti ryšį tarp dviejų kintamųjų Koreliacinės anal izės paskirtis – išmatuoti tiesinio ryšio tarp dviejų kintamųjų stiprumą Nagrinėja tik ryšio stiprumą
E N D
Ryšio nustatymas • Skaitmeniniai duomenys (koreliacija, regresija) • Kategoriniai duomenys
Koreliacija • Naudojama norint parodyti ryšį tarp dviejų kintamųjų • Koreliacinės analizės paskirtis – išmatuoti tiesinio ryšio tarp dviejų kintamųjų stiprumą • Nagrinėja tik ryšio stiprumą • Nesutapatinama su priežastingumu
Taškinių (scatter) diagramų pavyzdžiai Tiesiniai ryšiai Kreiviniai ryšiai y y x x y y x x
Taškinių diagramų pavyzdžiai Stiprūs ryšiai Silpni ryšiai y y x x y y x x
Taškinių diagramų pavyzdžiai Ryšio nėra y x y x
Koreliacijos koeficientas • Nepriklauso nuo mato vieneto • Tarp -1 ir 1 • Kuo arčiau -1, tuo stipresnis neigiamas tiesinis ryšys • Kuo arčiau 1, tuo stipresnis teigiamas tiesinis ryšys • Arti 0, ryšys silpnas arba jo nėra
Neigiamos reikšmės Aprašymas Teigiamos reikšmės 0.00 “nėra” 0.00 -0.19 - -0.01 “labai silpnas” 0.01 – 0.19 -0.39 - -0.20 “silpnas” 0.20 – 0.39 -0.69 - -0.40 “vidutinis” 0.40 – 0.69 -0.89 - -0.70 “stiprus” 0.70-0.89 -0.99 - -0.90 “labai stiprus” 0.90-0.99 -1.00 “visiškai tikslus” 1.00 Koreliacijos koeficiento interpretavimas Laipsnis, kuriuo taškai išsidėsto aplink tiesę
Pavyzdžiai r reikšmėms y y y x x x r = -1 r = -0,6 r = 0 y y x x r = +0,3 r = +1
Koreliacijos koeficientų tipai • Skaitmeniniams duomenims, normalaus skirstinio, n>20 - Pirsono (Pearson) • Ranginiams duomenims, arba skaitmeniniams, jei nenormalus skirstinys arba mažai stebėjimų • Spirmano (Spearman) • Kendalo (Kendall)
Koreliacijos koeficiento apskaičiavimas Pirsono koreliacijos koeficientas: kur: r = imties koreliacijos koeficientas x = nepriklausomo kintamojo reikšmė y = priklausomo kintamojo reikšme
Apskaičiavimo pavyzdys Medžio aukštis, y r = 0,886 → palyginti stiprus teigiamas tiesinis ryšys tarp x ir y Kamieno diametras, x
Koreliacijos koeficientonaudojimo klaidos • Kartotiniai tyrimai tų pačių tiriamųjų (ultragarso tyrimo metu vaisiaus matmenys 15-20 nėštumo savaitę, kartais ir kartojama) • Netinkama, kai įtakoja laikas, į ką neatsižvelgiama (mėsos suvartojimas ir mirtys nuo storosios žarnos vėžio) • Jei imtis susiaurinama (pvz. amžius) • Sumaišytos imtys (vyrų ir moterų riebalų proc. pagal amžių) • Dviejų metodų palyginimui (pvz. laboratoriniai, koreliacija neparodo sutapimo) • Priežastingumas
Kategorinių duomenų ryšys • Principas: • nustatyti ryšio stiprumą: • RR, OR • įrodyti skirtumą (PI, P reikšmė) • Ryšio matai (χ2, jei n >>1000, beveik visada atmetama H0): • Tarpusavio sutapimo rodiklis φ • Julo asociacijos koeficientas Q • Kontingencijos koeficientas C • Kramero koeficientas V • Sąlyginis prognozės indeksas λ (Gudmano, Kruskalo)
RYŠYS • RR: Turi antsvorio= a/(a+b)=25/39=0,64 Neturi antsvorio=c/(c+d)=30/66=0,45 0,64/0,45=1,42 k. • Rizikų skirtumas (absoliuti/atributinė rizika) AR=0,64-0,45=0,19 • OR=ad/bc=2,1 • χ2=3,4, tai P reikšmė...?
RYŠIO MATAI • Tarpusavio sutapimo rodiklis φ=0,18, φadj=0,223 (χ2=3,4)
RYŠIO MATAI Tarpusavio sutapimo rodiklis φ=1
RYŠIO MATAI • Julo asociacijos koeficientasQ=0,36 (nenaudojamas, jei yra 0) • 0-0,24 – ryšio nėra, arba jis labai silpnas 0,25-0,49 – silpnas ryšys 0,50-0,74 – vidutinio stiprumo ryšys 0,75-1 – stiprus ryšys
Skirtumai • Q geriau atskleidžia empirinį ryšį (antsvoris sąlygoja požiūrį, o ne atvirkščiai) • φ teisingiau nusako dvipusį ryšį (veikia vienas kitą, pvz. plaukų ir akių spalva)
RYŠIO MATAI • Kontingencijos koeficientas C Didesnės apimties lentelėms. • Kramerio V koeficientas Keturlaukėms lentelėms Kramerio V koeficientas sutampa su φ koeficientu.
KITI RYŠIO MATAI • Lambda (liambda, λ), • Goodman and Kruscal’s tau (liambda modifikacija – Gudmano-Kruskalio tau) • neapibrėžtumo koeficientas (uncertainty coefficient) Šie koeficientai skaičiuojami taip vadinamos proporcingo klaidos mažinimo koncepcijos pagrindu.