510 likes | 1.3k Views
BASİT DOĞRUSAL REGRESYON. İşlenecek olan konunun ardından Saçılım grafiğinin ne olduğu; İki değişken arasındaki ilişkinin hesaplanması ve yorumu . Hesaplanan ilişkinin anlamlı olup olmadığına karar verilmesi . Bir veri setinde basit doğrusal regresyon katsayılarının hesaplanması ve yorumu .
E N D
İşlenecek olan konunun ardından Saçılım grafiğinin ne olduğu; İki değişken arasındaki ilişkinin hesaplanması ve yorumu. Hesaplanan ilişkinin anlamlı olup olmadığına karar verilmesi. Bir veri setinde basit doğrusal regresyon katsayılarının hesaplanması ve yorumu. Regresyon analizi uygulamak için gerekli varsayımların ne olduğu? Kurulan regresyon modelin anlamlılığı.
Saçılım Grafiği • A Saçılım grafiğiiki değişken arasındaki ilişkiyi grafik olarak gösteren yardımcı bir araçtır. X-y grafiği olarak da adlandırılır.
Y X İki değişken arasındaki ilişki (a) Doğrusal
Y X İki değişken arasındaki ilişki (b) Doğrusal
Y X İki değişken arasındaki ilişki (c) Eğrisel
Y X İki değişken arasındaki ilişki (d) İlişki yok
Saçılım grafiği ( x-y grafiği) ile, iki değişken seti arasındaki ilişkinin doğrusal olup olmadığı ve ilişkinin yönü hakkında genel bir perspektif edinilir.Bununla birlikte ilişkinin yapısı ve yönü hakkında daha tutarlı ve hassas ölçülere ihtiyaç duyulur. Korelasyon katsayısı, iki değişken arasındaki ilişkiyi matematiksel olarak ölçen bir istatistiktir.
İLİŞKİ TİPLERİ Değişkenlerin tipi ve dağılımlarına göre farklı yollarla korelasyon katsayısı hesaplanır. Pearson's r:Her iki değişkenin(metrik kesikli ve/veya sürekli)Normal dağılım veya Normal dağılım özelliği gösterdiği durumlarda Pearson’s r korelasyon katsayısı kullanılır. • Spearman's rho:Her iki değişkenin metrik olmadığı sıralı ölçülerde veya Normal dağılım özelliği göstermediği durumlarda sıralamaya dayalı hesaplanan korelasyon değeridir.
Pearson’s Korelasyon Katsayısı (r) • Matematiksel gösterimi
Spearman's Korelasyon Katsayısı (rs) Spearman's rho (rs):Veri seti sıralandıktan sonra aşağıdaki formül ile korelasyon hesaplanır d= iki değişken arasındaki farkı belirtir
Korelasyon Katsayısı • Korelasyon katsayısı ( r ), x ve y değişkenleri arasındaki ilişkinin derecesini açıklar. • Korelasyon katsayısının ( r ) işareti, ilişkinin yönünün belirler. • Korelasyon katsayısı ( r ) –1 ve +1 arasındaki herhangi bir değer alabilir. • Korelasyon katsayısının işareti (r ) her zaman regresyon katsayısı ( b )’nın işareti ile aynıdır.
Korelasyon katsayısının aldığı değeri yorumlamak için: • rher zaman -1 +1 aralığındadır. Bu değer her iki yana çok yakın ise, saçılım grafiğinde noktalar arası bozulma o derece küçüktür. Bu nedenle iki değişken arasında güçlü bir ilişki sözkonusudur. • r -1 veya +1 değerlerine eşitse iki değişken arasında mükemmel bir ilişki vardır. Saçılım grafiğinde tüm noktalar doğru üzerinde gözükecektir. (bu doğru regresyon doğrusu olarak bilinir). Eğerr0’a çok yakın bir değer almışsa, the bozulma oldukça büyük görünecek ve değişkenler birbiri ile ilişki göstermeyeceklerdir. Korelasyon katsayısındaki( r ) pozitif veya negatif işaretiki değişken arasında pozitif veya negatif ilişkinin varlığına işaret eder.
KORELASYON KATSAYISININ GÜCÜ r = -1:Mükemmel negatif bir ilişki ( x yukarı çıkarken, y aşağı doğru) r = +1:Mükemmel pozitif bir ilişki ( x yukarı çıkarken, y yukarı çıkar) r = 0:x ve y arasında bir ilişki görülmemektedir Bu değerlerin dışında bir katsayı hesaplandığında genel olarak korelasyon katsayısı ( r ) için: 0.0 ile 0.2 Çok zayıf veya ihmal edilebilir bir ilişki0.2 ile 0.4 Zayıf, düşük ilişki0.4 ile 0.7 orta derecedeilişki0.7 ile 0.9 Güçlü, yüksekilişki0.9 ile 1.0 Çok yüksek ilişki
Saçılım Grafiği r= -1 r= 0 r= +1 MükemmelİlişkiyokMükemmel negatif pozitif
Örnek:Hemoglobin verilerini kullanarakPearson’s ve Spearman’s korelasyon katsayılarını hesaplayıp, yorumlayınız.
Pearson’s KorelasyonKatsayısı Hemoglobin düzeyi ile hamilelik (hafta) arasında negatifgüçlü bir ilişki vardır. (Pearson’s r= -0.922)
Spearman’s Korelasyon Katsayısı (rs) R1: Hafta sıralaması; R2: hemoglobin düzeyi sıralaması
Spearman’s KorelasyonKatsayısı (rs) Hemoglobin düzeyi ile hamilelik (hafta) arasında negatifgüçlü bir ilişki vardır. (Spearman’s rho rs= -0.916).
BASİT DOĞRUSAL REGRESYON • Doğrusal regresyon analizi, bağımlı değişken ile bir veya daha fazla bağımsız değişken arasında bir ilişki kurar. • Doğrusal model, bağımlı değişkeni bağımsız değişkenin aldığı değerin doğrudan oranı olarak gösterir. • Basit Doğrusal regresyon analizinde sadece bir bağımsız değişken bulunur.
Bağımlı değişken (y); regresyon modelinde açıklanan veya tahmin edilecek olan değişkendir. Bu değişkenin bağımsız değişkenle fonksiyonel bir ilişkide olduğu varsayılır. • Bağımsız değişken (x)regresyon modelinde bağımlı değişken ile ilişkili değişkendir.Bağımsız değişken, regresyon modelinde bağımlı değişkenin değerini tahmin etmek için kullanılır.
BASİT DOĞRUSAL REGRESYON MODELİ(POPULASYON MODELİ) y = + βx + ε y= bağımlı değişken x= bağımsız değişken = sabit (y-eksenini kestiği nokta) β= regresyon doğrusunun eğimi ε= hata terimi veya artık
Regresyon Parametreleri = sabit • doğrunun y eksenini kestiği nokta. • Bağımsız değişkenin değerinin = 0 olduğu durumda bağımlı değişkenin aldığı değerdir. β = eğim • Bağımsız değişkendeki değişime dayalı olarak bağımlı değişkende görülen değişimdir. • Eğimin alacağı katsayının işareti iki değişken arasındaki ilişkiye bağlı olarak pozitif veya negatif olabilir.
TAHMİN EDİLEN REGRESYON MODELİ (ÖRNEKLEM MODELİ) = Tahmin edilen y değeri (bağımlı değişken) a = regresyon sabit değerinin yansız tahmini b = regresyon eğiminin yansız tahmini x = bağımsız değişken değeri
Basit doğrusal regresyon modelin bazı varsayımları bulunmaktadır: • Ihata terimlerinin her biri istatistiksel olarak bir diğerinden bağımsızdır. • hata terimlerinin aldığı değerler normal dağılım özelliği göstermelidir. • Hata varyansı sabittir ve veriler arasında hiç değişmediği varsayılır. Buna otokorelasyon veya serisel korelasyon bulunmaması varsayımı adı verilir. • Bağımsız değişken hatasızdır. Eğer bağımsız değişkende hata bulunduğu varsayılırsa özel bir yöntem şekli olan değişkenler-içinde-hata modeli teknikler kullanılarak model kurulmalıdır.
ε = Hata terimi(artık) • Regresyon modelleri tam (%100) doğru tahmin yapma özeliğine sahip değillerdir. Hata terimi (artık), gözlenen değer ile model tarafından tahmin edilen değer arasındaki farktır.
Artık terminin (hata) grafiksel gösterimi Y 390 400 300 312 200 100 X 4 ε= Artık = 312 - 390 = -78
Regresyon Parametrelerinin Tahmini b ve a katsayıları aşağıdaki eşitlikler kullanılarak hesaplanır :
En küçük kareler (EKK)yöntemi kullanılarak modeldeki artık kareler toplamı minimize edilerek parametre tahminleri yapılır.
Örnek:Hamilelik haftası ile hemoglobin düzeyi arasında anlamlı bir ilişki bulunmakta mıdır?Basit doğrusal regresyon modelini oluşturarakeğim parametresinin anlamlılığını test ediniz.
Regresyon parametrelerinin tahmini Eğim parametresinin (b) anlamlılığının testi tα, n-(p+1)= t(0.05, 18)= 2.1, t= 10.1 > t(0.05, 18)= 2.1, red H0; eğim sıfır değildir. (n= örneklem genişliği, p= bağımsız değişken sayısı)
ARALIK TAHMİNİ Tahminler çekilen örnekten örneğe değişeceğinden regresyon katsayılarını standart hataları ile vermek yerinde olacaktır , . Tahminlerin standart hataları çoğu istatistik paket programının çıktılarında confidence interval (güven aralığı) CI olarak gösterilir ve β’nın içinde bulunduğu aralık ile birlikte verilir: (1-α)% CI for β 95% güven aralığındaβ: (-4.000, -0.263) (t(0.05, 18)= 2.1).
Belirtme katsayısı (determinasyon katsayısı)Belirtme katsayısı, doğrusal modelin uyum iyiliğinin en iyi ölçüsüdür. Bağımlı değişkendeki değişimin ne kadarının bağımsız değişken (ler) tarafından açıklandığını ifade eder. Bu durum, regresyon modelinin açıklayıcılık gücünün iyi bir göstergesidir. ( R2) Örneğimizde, hemoglobin düzeyindeki değişimin %85’nin hamileliğin bulunduğu hafta ile açıklanabileceği hesaplanmıştır. (R2= 0.85).
Örnek:SPSS ile yaş ile %yağ değişkenleri arasındaki ilişkiyi Person ve Spearman’s korelasyon katsayıları kullanarak hesaplayınız. Değişkenler arasında anlamlı bir ilişki varsa regresyon modelini oluşturarak modelin anlamlılığını test ediniz.