270 likes | 508 Views
Lineer Regresyonla Model Oluşturma. Doğrusal Regresyonla Deneysel Model O luşturma. Regresyonda 1. Modelin denklemini belirle (en az parametreli uygun bir model ) 2. Modeli veriye uydur 3. Modelin uygunluğunu kontrol et. Uygun değil. uygun. M odeli Kullan. Madde miktarı.
E N D
Doğrusal Regresyonla Deneysel Model Oluşturma • Regresyonda • 1. Modelin denklemini belirle (en az parametreli uygun bir model) • 2. Modeli veriye uydur • 3. Modelin uygunluğunu kontrol et Uygun değil uygun Modeli Kullan
Madde miktarı Tank Taban Alanı M = C0zA 0 0 Çökme zamanı = t Çökme tankında çöken katı oranı (R(z,t)) herhangi bir z yüksekliğinde t kalış zamanı ile: derinlik dz z z C(z,t) Katı Konsantrasyonu C0 Katı Konsantrasyonu
Tanktaki zamana bağlı olarak farklı derinliklerde ölçülmüş AKM konsantrasyonları aşağıda verilmiştir. Buna göre eğer ilk konsantrasyon değeri C0 =500 mg/l ise, 8 saat sonra tanktan çıkarılan katı madde miktarı nedir? Bu integral grafiksel olarak hesaplanabilir. Ya da C(z,t) için z ve t’ye bağlı olarak bir modelle tanımlanabilir: C(z,t) = b0 + b1t + b2t2 + b3z+b4z2+b5zt Bu örnek için uygun modelin C(z,t) =167 +11.9z-2.74t+0.014t2-0.08zt olduğunu varsayalım. t = 60 dak. ‘da konsantrasyon profili : C(z,60) = 53.0 +7.1z
C(z,60) = 53.0 +7.1z Çıkarılan Katı Miktarı=(500 mg/l)%95 = 475 mg/l
Model Oluşturma • 1. EN BASİT MODELDEN BAŞLA • 1. En basit en az parametreli modeli seç. • 2. Model parametrelerini belirle (a,b,c) • 3. Belirleme katsayısını (R2), kalanların ortalama karesini (MS) hesapla ve kalanların dağılımını çiz.
1. Modeli Seç ve Parametreleri t = t1 t = t2 t = 0 Üç parametreli zamana ve konsantrasyona bağlı bir model oluşturalım: y = a + bt +cz Excel’de Araçlar/veri çözümleme / Regresyon (çoklu) y = 132.3 + 7.125 z-0.968t
Excel’de Çoklu Regresyon Excel’de Araçlar/veri çözümleme / Regresyon (çoklu) Excel’de Özet Çıkışı y = 132.3 + 7.125 z-0.968t
2. Model Değerlendirme • R2 = 0.844 (Belirleme katsayısı: modelin veride yakaladığı değişkenlik yüzdesi. • RMS = S(y-ỹ)2/v =355.82 : kalanların ortalama karesi: Model tarafından açıklanamayan değişimin önemi, küçük olması istenir. • Kalanların grafiksel kontrolü
Modelde Değişiklik • Zamana bağlı grafikten modele bir t2 teriminin eklenmesi uygun gözüküyor. Regresyon sonucu: y = 185.97 + 7.125t + 0.014t2 -3.057z R2 = 0.97 RMS = 81.5 Kalanların grafiği sayfa 225, Şekil 28.3’de görüldüğü gibi rastsal görünüyor. Bu modelin veriyi tanımlamakta başarılı olduğunu söyleyebiliriz.
2. KARMAŞIK MODELDEN BAŞLA Hesaplanan değerlerin ortalamadan farkının kareleri toplamı C(z,t) = b0 + b1t + b2t2 + b3z+b4z2+b5zt Kalanların Kareleri Toplamı SS + RSS R2 =SS /SST = 20255/20564 =98.5 Model değişimin %98.5’unu açıklayabiliyor. Yüksek R2 değerlerinin olması istenilen bir şeydir. Ancak regresyonun amacı yüksek R2 elde etmekten çok en basit ve uygun modeli belirlemektir. Yüksek R2 değerleri modele daha yüksek dereceli terimler ekleyerek elde edilir.
1. Parametrelerin güvenilirlik aralığına bakılır. Eğer 0, bu aralık içindeyse o parametreli terim modelden çıkarılabilir. Örneğin model A’da z2’nin parametresi [-3.81 1.56], atılabilir. 2. İki modelin kareleri toplamının farkını test et. z2 parametresi düşünce 54 büyüklüğünde bir fark oluşuyor. Bunu z2li terimin varyansı olarak düşünülebilir. Peki 54’lük bir azalma istatistiksel olarak anlamlı bir fark mı?
Anlamlı bir fark olup olmadığını anlamak için saf deneysel hatadan kaynaklanan hatanın değerine ihtiyaç var. Tekrar ölçümler olmadığından RMS, 51.5’u deneylerin saf hata varyansı olarak alabiliriz. • Model A ve B arasındaki SS farkı: 54 • Model A için hata varyansı : 51.5 54 > 51.5 ?
54 > 51,5 ? F = 54/51,5 = 1,06 Fk (0.05,k-m,n-k-1)=F(0,05;1;6)= 5,99 F<Fk . =1,06 < 5,99. z2’li terimi atmanın regresyon kare toplamında önemli bir azalmaya neden olmadığını söyleyebiliriz. F kriteri yaklaşımıyla diğer modelleri inceleyebiliriz.
F testi kriteri: Bu test maksimum parametre sayısına (b1..bk) sahip modeldeki eksiltilmesi düşünülen parametrelerin daha az parametreli (b1..bm…bk) bir model elde etmek üzere anlamlılığını test etme esasına dayanır. Başka bir deyişle eksiltilmiş parametreli modelin kullanılmasından oluşan kalanların kareleri toplamlarındaki (RSS) farkın (ki bu eksiltilen terimlerden kaynaklanan varyans olarak da düşünülebilir (RSSm –RSSk)/(k-m)) istatistiksel olarak sırf deney hatalarından kaynaklanan varyanstan farklı olup olmadığına bakılır. Tekrar ölçümler yapılmadığından bu hatayı maksimum parametreli modelin kalanların karelerinin toplamından yola çıkarak yaklaşık olarak belirleyebiliriz (RSS/(n-k-1)). Bu durumda: m: eksiltilmiş parametreli modeldeki parametre sayısı k: maksimum parametreli modeldeki parametre sayısı n: Gözlem sayısı
Fm F istatiksel dağılımına sahip. Bakacağımız hipotez ise: • Eğer reddedilmezse, eksiltilmiş parametreli model maksimum parametreli model kadar veriye uygundur ve onun yerine kullanılabilir diyebiliriz. Böylece en düşük parametre sayısı olan en uygun model belirlenmiş olur.
SPSS ile Lineer Olmayan Model Oluşturma • Yandaki veriye y = b1*exp(b2*x) eşitliğini uydurun. 1.“Analyze/Regression/Nonlinear” ‘seçin • 2. Dependent parametreniz için y’yi solda çıkan listeden okla seçin
SPSS ile Lineer Olmayan Model Oluşturma • Listenin altındaki Parameters düğmesine basıp, modelin parametreleri b1 ve b2’yi başlangıç değerleriyle birlikte girin. • Model Expression kutusuna model denklemini girin. • B1*exp(b2*x) • Sağdaki OK tuşuna basın
Output Iteration Residual SS B B2 1 4,3915E+13 ,100000000 ,200000000 1.1 26593312,82 ,000079334 ,199991331 2 26593312,82 ,000079334 ,199991331 2.1 3509234,234 ,000079390 ,189056131 3 3509234,234 ,000079390 ,189056131 3.1 217434,3629 ,000159843 ,167185734 4 217434,3629 ,000159843 ,167185734 4.1 11425,13724 ,000626792 ,125476012 5 11425,13724 ,000626792 ,125476012 5.1 20121,44669 ,005973521 ,042058594 5.2 13773,97887 ,002482860 ,104551852 5.3 9205,413848 ,001754074 ,117599275 6 9205,413848 ,001754074 ,117599275 6.1 8280,634390 ,003926462 ,109724924
Output, Devam Iteration Residual SS B B2 20 934,7369014 2,97949890 ,037813991 20.1 537,1364318 4,01009844 ,035053003 21 537,1364318 4,01009844 ,035053003 21.1 453,6448913 6,07127044 ,029398240 22 453,6448913 6,07127044 ,029398240 22.1 259,1495492 7,73705857 ,027306463 23 259,1495492 7,73705857 ,027306463 23.1 245,4960955 7,65706718 ,027773991 24 245,4960955 7,65706718 ,027773991 24.1 245,4813975 7,68949079 ,027715779 25 245,4813975 7,68949079 ,027715779 25.1 245,4812578 7,68593653 ,027721816 26 245,4812578 7,68593653 ,027721816 26.1 245,4812564 7,68631159 ,027721191
Output, Devam Run stopped after 54 model evaluations and 26 derivative evaluations. Iterations have been stopped because the relative reduction between successive residual sums of squares is at most SSCON = 1,000E-08 Nonlinear Regression Summary Statistics Dependent Variable y Source DF Sum of Squares Mean Square Regression 2 19972,51874 9986,25937 Residual 5 245,48126 49,09625 Uncorrected Total 7 20218,00000 (Corrected Total) 6 5035,71429 R squared = 1 - Residual SS / Corrected SS = ,95125 Asymptotic 95 % Asymptotic Confidence Interval Parameter Estimate Std. Error Lower Upper B 7,686311592 2,077462596 2,346023978 13,026599205 B2 ,027721191 ,003407453 ,018962055 ,036480328