490 likes | 1.02k Views
VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ. Uygun Analiz Türünün Belirlenmesi.
E N D
VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ
Uygun Analiz Türünün Belirlenmesi Uygun analiz türünün belirlenmesinde ilk kriter verilerin türüdür. Analiz yöntemleri verilerin özelliklerine göre iki temel gruba ayrılır. Bu gruplarda yer alan temel analiz yöntemleri aşağıdaki gibidir. 1)Parametrik veriler için kullanılan analiz yöntemleri; Varyans Analizi, T-Testi, Pearson Korelasyonu 2)Parametrik olmayan veriler için kullanılan analiz yöntemleri; Ki-Kare Testleri, Spearman Korelasyonu.
Analiz Türünün Belirlenmesi Dolayısıyla uygun analiz türünü seçebilmek için öncelikle verilerin özelliklerinin belirlenmesi gerekecektir. Şimdi bunu nasıl yapacağımız görelim. İstatistiksel analiz yapmanın ilk şartı verilerin tesadüfi (yansız)olarak seçilmiş olmasıdır. Veriler ister parametrik ister parametrik olmayan özellikte olsun mutlaka tesadüfi olarak seçilmelidir.
Analiz Türünün Belirlenmesi • Eğer örneklem büyüklüğünüz 30’dan az ise parametrik olmayan yöntemleri kullanmanız gerek. Bu durumda veri setinizin diğer kriterleri karşılayıp karşılamadığını incelemenize gerek kalmaz. • Eğer veri seti 30’dan büyük ise (parametrik test) her bir faktörü normal dağılıma sahip olup olmadığını ve verilerin homojen dağılıp dağılmadığını incelemeliyiz.
Normalliğinin İncelenmesi • Şimdi bu iki şartın sağlanıp sağlanmadığını SPSS’de nasıl ölçeceğimizi Bir örnek üzerinde inceleyelim. Örnek: Beşiktaş ilçesindeki ilköğretim okullarında görev yapan öğretmenlerin “eleştirel öğrenme”, “çoklu öğrenme”, “yapılandırmacı öğrenme” ve “duygusal zeka” hakkındaki görüşleri cinsiyetlerine göre farklılık göstermekte midir?
Normalliğinin İncelenmesi NORMALLİK • Verilerin normal dağılıma uygun olup olmadığını ortaya koymak için çeşitli normallik testlerinden yararlanmak mümkündür. Bu testler arasında en bilinenleri Ki-Kare , KolmogorowSmirnow normallik testleridir. • Verilerin normal dağılıma uygunluğunu biz bu örnekte Tek ÖrneklemKolmogorovSmirnov Testi kullanarak belirliyoruz. • ANALYZE » NONPARAMETRIC TESTS » SAMPLE K-S
Normalliğinin İncelenmesi Karşınıza aşağıdaki iletişim kutusu çıkacaktır. Burada dağılımlarını test edeceğiniz faktörleri aradaki oku kullanarak Test VariableListkutucuğuna gönderin. Daha sonra OK tuşunu tıklayın.
Normalliğinin İncelenmesi Tablonun Assymp.Sig. (Anlamlılık) satırındaki değerlerin istatistiksel anlamlılık hesaplamalarında sınır değeri kabul edilen 0,05’den büyük olması incelenen faktörlerin dağılımlarının normal olduğunu göstermektedir. Eğer bu değerler 0,05’den küçük olsa idi parametrik olmayan test yöntemlerini kullanmak durumunda kalacaktık.
Homojenlik • Şimdi aynı verilerin homojenliğini inceleyelim. Bunun için öncelikle aşağıdaki mönüleri kullanınız. ANALYZE » COMPARE MEANS » ONEWAY ANOVA
Homojenliğinin İncelenmesi Karşınıza aşağıdaki iletişim kutusu çıkacaktır. Burada dağılımlarını test edeceğiniz faktörleri aradaki oku kullanarak Dependent List kutucuğuna gönderin. Daha sonra bu değişkenleri gruplamada kullanacağınız değişkeni yine aradaki oku kullanarak Factorsatırına yerleştirin.
Homojenliğinin İncelenmesi Daha sonra Options tuşuna basın . Kaşınıza çıkacak aşağıdaki iletişim kutusundan Homogeneity of variancetest seçeneğini işaretleyin. Sırasıyla Continue ve OK tuşlarını tıklayın.
Karşınıza aşağıdaki Test of Homogenity of Variances tablosu gelecektir.Bu tablonun da Sig. (Anlamlılık) sütunundaki değerlerin0,05’den büyük olması incelenen faktörlerin dağılımlarının homojen olduğunu göstermektedir. Dolayısıyla bu soru için parametrik test yöntemlerini kullanabiliriz. Homojenliğinin İncelenmesi
Korelasyon analizi, iki değişken arasındaki doğrusal ilişkiyi veya bir değişkenin iki yada daha çok değişken ile olan ilişkisini test etmek, varsa bu ilişkinin derecesini ölçmek için kullanılan istatistiksel bir yöntemdir.
Korelasyon analizinde amaç; bağımsız değişken (X) değiştiğinde, bağımlı değişkenin (Y) ne yönde değişeceğini görmektir. Korelasyon analizi yapabilmek için, her iki değişkenin de sürekli olmaları ve normal dağılım göstermeleri gereklidir.
Korelasyon analizi sonucunda, doğrusal ilişki olup olmadığı ve varsa bu ilişkinin derecesi korelasyon katsayısı ile hesaplanır. Korelasyon katsayısı “r” ile gösterilir ve -1 ile +1 arasında değerler alır.
Pozitif bir ilişkinin olması X değişkeninin değerlerinin artması durumunda Y değişkeninin değerlerinin de artması, yada X değişkeninin değerlerinin düşmesi durumunda Y değişkenine ait değerlerin de düşme eğiliminde olduğunu gösterir (Şekil1. a.)
Negatif korelasyon (negatif ilişki) olması değişkenlerin birine ait değerlerin artması durumunda diğer değişkene ait değerlerin düşmesi demektir (Şekil1. b.). Korelasyon katsayısının “0” olması değişkenler arasında doğrusal bir ilişkinin söz konusu olmadığını gösterir (Şekil 1. c.). Korelasyon, neden sonuç ilişkisi anlamına gelmemektedir.
PEARSON KORELASYON KATSAYISI Pearson Korelasyon Katsayısı, iki sürekli değişkenin doğrusal ilişkisinin derecesinin ölçümünde kullanılır. İki değişken arasında anlamlı bir ilişki var mıdır sorusunun cevabı aranır. Korelasyon katsayısı hesaplanmadan önce mutlaka serpilme grafiği yapılarak doğrusal ilişki olup olmadığı kontrol edilmelidir.
Korelasyon katsayısı -1 ile +1 arasında değerler alır. Eğer; r=-1 ise Tam negatif doğrusal bir ilişki vardır. r=+1 ise, Tam pozitif doğrusal bir ilişki vardır. r=0 ise, iki değişken arasında ilişki yoktur.
Pearson Korelasyon Katsayısının yorumu; r İlişki 0,00-0,25 Çok Zayıf 0,26-0,49 Zayıf 0,50-0,69 Orta 0,70-0,89 Yüksek 0,90-1,00 Çok Yüksek
ÖRNEK UYGULAMA Fen bilgisi laboratuar dersini alan bir grup öğrencinin bilimsel süreç becerisi (BSB) puanları ile ders başarı puanları arasında anlamlı bir ilişki var mıdır? Şeklindeki bir araştırma sorusunun cevabını araştıralım.
Örneğimize ait veriler SPSS te girildikten sonra verileri özelliklerine bakılır. Verilerin sürekli olduğu görülmektedir. Normal dağılıma bakılır; Veriler normal dağılıma uygunsa Pearson Korelasyon Katsayısı, Normal dağılım göstermiyorsa Sperman Sıra Korelasyonu hesaplanır. Ayrıca doğrusal ilişki olup olmadığını görmek için serpilme diyagramı çizilir.
Saçılma grafiği incelendiğinde değişkenler arasında pozitif bir doğrusal ilişki olduğu görülmektedir. Veriler kontrol edildikten sonra korelasyon analizine geçilir. Analiz için aşağıdaki şekilde gösterilen komutlar takip edilir.
Değişkenler aktarıldıktan sonra CorrelationCoefficients kısmından Pearson (eğer veriler normal dağılmıyorsa Sperman) işaretlenir. Burada biz karşılaştırma için her ikisini de seçtik. Diğer seçenekler işaretlidir. Aynen kalacaktır. OK işaretlenerek analiz tamamlanır ve çıktılar alınır.
Yukarıdaki tablolardan birincisi Pearson Korelasyonuna ikincisi Sperman korelasyonuna aittir. tablolar incelendiğinde, Öğrencilerin bilimsel süreç becerileri ile ders başarıları arasında çok yüksek, pozitif yönlü ve anlamlı bir ilişki olduğu görülmektedir [r(20)=0,992; p<0,01].
Buna göre, bilimsel süreç becerisi yüksek olan öğrencilerin laboratuar başarısı da yüksektir. Aynı şekilde bilimsel süreç becerileri düşük olan öğrencilerin ders başarısı da düşüktür şeklinde ifade edilebilir.
REGRESYON ANALİZİ Regresyon analizi, aralarında sebep-sonuç ilişkisi bulunan iki veya daha fazla değişken arasındaki ilişkiyi belirlemek ve bu ilişkiyi kullanarak o konu ile ilgili tahminler ya da kestirimler yapabilmek amacıyla yapılır. Bu analiz tekniğinde iki (basit regresyon) veya daha fazla değişken (çoklu regresyon) arasındaki ilişkiyi açıklamak için matematiksel bir model kullanılır ve bu model regresyon modeli olarak adlandırılır.
BASİT DOĞRUSAL REGRESYON Regresyon analizinde bağımlı değişken sayısı her zaman tektir. Eğer bağımsız değişken de tek ise “Basit Doğrusal Regresyon” adı verilir. SPSS uygulamalı regresyon analizini bir örnek ile açıklayalım; Öğrencilerin fen bilgisi notlarından matematik notlarını tahmin edebilir miyiz? • H0 (boş hipotez): Öğrencilerin matematik ve fen notları arasında doğrusal bir ilişki yoktur. • H1 (araştırma hipotezi): Öğrencilerin matematik ve fen notları arasında doğrusal bir ilişki vardır.
ÇIKTI YORUMU Matematik notu bağımlı değişken , Fen Bilgisi notu ise bağımsız değişkendir.Bağımsız değişken bağımlı değişkendeki değişimin yaklaşık %40 açıklar. Bağımlı değişkenle bağımsız değişken için kurulacak regresyon modeli istatistiksel olarak anlamlıdır (F=130.808 ,p=0.00) . Nitekim Matematik notu ile Fen Bilgisi notu arasında pozitif bir ilişki vardır ve bu ilişki istatistiksel olarak anlamlıdır.
ÇOKLU DOĞRUSAL REGRESYON Regresyon analizinde bağımlı değişken sayısı her zaman tektir. Eğer bağımsız değişken de tek ise “Basit Doğrusal Regresyon” adı verilir. Öğrencilerin matematik notunu, fen bilgisi ve sosyal bilgiler puanlarından tahmin edebilir miyiz?
Tablo 7. Öğrencilerin matematik notlarının fen bilgisi ve sosyal bilgiler notlarına göre tahmini için yapılan çoklu regresyon analizi sonuçları βt p F p • Regresyon katsayısı 14,358 4,96 0,000 • Fen bilgisi notu 0,482 8,286 0,000 0,478 90,304 0,000 • Sosyal bilgiler notu 0,320 5,512 0,000 • Matematik notu bağımlı değişken, fen bilgisi ve sosyal bilgiler notları bağımsız değişkenlerdir • (tahmin değişkenleridir). Fen bilgisi ve sosyal bilgiler notları birlikte matematik notundaki • değişimin %48’ini açıklamaktadırlar (=0,478).
(Not: Fen bilgisi ile sosyal bilgiler notlarının bağımsız değişken olarak birlikte alındığı çoklu regresyon modeli, matematik notundaki değişimi, yalnızca fen bilgisi notunun alındığı basit regresyon modelinden daha iyi açıklamaktadır.) • Bağımlı değişken ve tahmin değişkenleri için kurulacak çoklu regresyon modeli istatistiksel olarak anlamlıdır (F=90,304, p=0,000). • Fen bilgisi ve sosyal bilgiler notları birlikte matematik notundaki değişimin yaklaşık %48’ini açıklamaktadır (=0,478). Nitekim, matematik notuyla fen bilgisi notu ve sosyal bilgiler notu arasında pozitif ilişkiler vardır (0,482; 0,320) ve bu ilişkiler istatistiksel olarak anlamlıdır (tfen=8,286, pfen=0,000; tsosyal=5,512, psosyal=0,000) • Çoklu regresyon modeli: Matematik notu=14,358+0,482*Fen bilgisi notu+0,320*Sosyal bilgiler notu