270 likes | 679 Views
ANOVA. K tane ortalamanın Karşılaştırılması: Varyans Analizi. Varyansın analizi (ANOVA) iki ya da daha fazla örneklem ortalamalarının aynı gerçek ortalamaya sahip bir yığından elde edilip edilemeyeceğini belirlemek için yapılır.
E N D
K tane ortalamanın Karşılaştırılması: Varyans Analizi • Varyansın analizi (ANOVA) iki ya da daha fazla örneklem ortalamalarının aynı gerçek ortalamaya sahip bir yığından elde edilip edilemeyeceğini belirlemek için yapılır. Varyansın karşılaştırılması F dağılımı kullanılarak gerçekleştirilir. F testi.
Varyans (Değişke) Analizi • Örneklem varyanslarının dağılımı c2 dağılımına sahiptir. • c2 dağılımları çarpık dağılımlar olup şekilleri serbestlik derecesine göre değişir. • Aynı yığına ait normal dağılım gösteren iki örneklemin varyanslarının oranı da F dağılımına göre değişir.
c2 Dağılımı Normal Dağılım (z) t dağılım (t test) c2 Dağılım F dağılım (F test)
Tek Yönlü Varyans Analizi • Eğer gruplar arasında sadece tek bir faktörün etkisine bakılacaksa tek yönlüvaryans analizi yapılır. • k farklı grup verisinin karşılaştıracağını varsayalım. Her grup için nt tane tekrar gözlem yapılmış olsun. Toplam gözlem sayısı N = Snt t = 1,2, 3, …k • Her yöntem için tekrar ölçümler arasında rastsal bir değişkenlik olacaktır. Ancak bu, rastsal ölçüm hatalarından kaynaklanıyorsa sadece rastsal deney hatalarına ait yaklaşık bir değeri verecektir. k metodun farklı olup olmadığını anlamak için yöntemler arasındaki farklılığın incelenmesi gerekir.
Örneklem İçindeki Değişkenlik Örneklemler Arası Değişkenlik Tek Yönlü Varyans Analizi
Tek Yönlü Varyans Analizi • Her grubun varyans (st2): • Tüm grupların aynı yığın varyansına sahip olduğunu varsayarak örneklem içi varyans (sw2)hesaplanır. • Gruplar arası varyans ise grup ortalamaları ile toplam ortalamayı kullanarak hesaplanır. Her yöntemde eşit sayıda ölçüm varsa
Örneklemler içinde Örneklemler Arasında • Eğer deney sonuçlarını etkileyen bilinmedik bir etken yoksa, sw2 sırf ölçüm hatalarından kaynaklanan varyans s2’nin yaklaşık değerini verir. • Eğer yöntem ortalamaları arasında şans eseri beklenenin dışında bir fark yoksa yöntemler arası sb2 de sadece rastsal ölçüm hatalarını belirler. Böyle bir durumda sw2’ye eşit olması beklenir. s2’nin hesaplanmış ikinci bir yaklaşık değeridir. • Eğer gerçek ortalama yöntemden yönteme fark gösteriyorsa sb2’nin değeri şişecek ve sw2’den yüksek olacaktır. • Ho: k ortalama arasında fark yoktur Bunu anlamak için s2’nin iki tahmini değeri sw2 ve sb2 büyüklüğünün istatistiksel olarak aynı olup olmadığı kontrol edilir. Aynıysalar, ortalamanın farklı olduğuna dair güçlü bir kanıt yok diyebiliriz. Farklıysalar, yani sb2’nin değeri fazlaysa ortalamaların farklı olduğu sonucunu çıkarırız. Varyanslar arasında fark olup olmadığını ise F testi uygulayarak bilebiliriz.
Örnek A, B ve C metotlarının arasında bir fark olup olmadığı hakkında ne söylenebilir?
Örnek • 6.06 ? • 52
6.06 • 52? • Bu soruya yanıt vermek için F testi yapmalıyız: • F dağılımı örneklem varyans oranının dağılımına ve serbestlik derecesine göre tabloya konmuştur. Pay örneklemler arası varyans, payda ise örneklemler içindeki varyanstır. • Fv1,v2,a=F2,9,0.05=4.74 (Excel’de =FTERS(0.05;2;9)) • Hesaplanan Fh = 52/6.06 = 8.67 • Fh > Fk sb2 >sw2. Yani üç yöntemden alınan ortalamalar eşit değil. Ancak hangisinin bu eşitliği bozduğunu bilemeyiz. Farklı olanı bulmak farklı bir yöntem gerektirir.
ANOVA Fonksiyonu • Eğer ANOVAyı bir yazılım programı kullanarak yaparsanız, çoğunlukla aşağıdaki tabloya benzer bir ANOVA sonuç tablosu alırsınız. • Excel’de ANOVA için Araçlar/veri çözümleme/ Tek etken Anova: Kareleri alınmış sapmaların Toplamı Serbestlik derecesine bölünmüş sapma kareleri toplamı Serbestlik Derecesi Fk Fh Fh değeri elde etme yüzdesi
Örnek • Standart çözeltiden 50 alikot hazırlanıp 5 ayrı laboratuara gönderiliyor. Laboratuarların ölçümleri arasında bir fark olup olmadığı konusunda ne söylenebilir?
Şekilden görüldüğü gibi, sonuçlardaki değişkenlik her laboratuar için hemen hemen aynı. Lab 4 ve 5 toplam ortalamanın biraz daha altında sonuç veriyor. Tek bir laboratuardaki varyans rassal hatalardan (numune hazırlama ve analizde ortaya çıkan) kaynaklanır. Laboratuarlar arası varyans ise deney yapma sırasında gerçekten var olan bir farktan veya rastsal değişkenlikten oluşur. Eğer laboratuarlar arasındaki fark rastsal ise 5 laboratuardan alınan ortalama değerler toplam ortalama civarında rastsal olarak değişecektir ve 5 lab ortalamasının varyansı lab içindeki varyansla aynı olacaktır. Varyanslar aynı mı?
Fh >Fk 6.77 > 2.58 Bu durumda laboratuarlar arasındaki değişkenlik laboratuar içindeki değişkenlikten daha büyük. Yani laboratuarların ölçümleri arasında bir fark olduğunu söyleyebiliriz. Lab 4 hepsinden daha küçük bir ortalamaya sahip olduğundan diğerlerinden farklıdır sonucu çıkarılabilir. Ama 4 ve 5 diğer üçünden farklı olabilir. Laboratuar 3 en yüksek ortalamaya sahip olduğundan belki farklı olan odur.
NOT • ANOVA bize hangi laboratuarın ya da kaç laboratuarın farklı olduğunu söylemez, sadece onların aynı sonucu vermediği gerçeğini çıkarabiliriz. ANOVA’dan sonra diğer sorulacak sorular: • Hangi lablar farklı hangileri aynı (Çoklu eşli karşılaştırma, güvenilirlik sınırları ile grafikle gösterme) • Hangi lab doğru sonucu veriyor? (En yüksek ölçen belki de ne doğru ölçen.) • ANOVA birden fazla etkenin olduğu problemlere de uygulanabilir.
Güvenirlik Sınırları ile Grafik • Her bir labın ortalamasının %95 güvenirlik aralıği hesaplanarak grafikte gösterilebilir. • Standart çözeltinin konsantrasyonu bilindiği takdirde hangi lablarda sorun olduğu belirlenebilir. • Excelde Araçlar/Veri Çözümleme / Tanımlayıcı İstatistik (Özet istatistikler ve güvenirlik kutuları işaretli)
Güvenirlik Sınırları ile Grafik Excel’de Özet İstatistik Çıktısı
Güvenirlik Sınırları ile Grafik Standart değerin 4 olduğunu varsayarsak Lab 4 ve 5’in sorunlu olduğunu düşünebiliriz.
2 Etkenli Anova • Farklı safsızlık dereceleri ve soğutma hızları ile sentezlenen kristallerin elektrik özellikleri ölçüldü. • Safsızlık türünün önemli bir etkisi var mı? • Soğutma oranı önemli bir etki gösteriyor mu?
Excel’de 2 faktörlü AnovaAraçlar /Veri Çözümleme / Anova –Yinelemesiz Çift Etken
Sonuçların Yorumlanması • Satırlar: Safsızlık Tipi • F >Fk, p < 0.05 • Sıfır hipotezini reddet, yani safsızlık tipinin etkisi anlamlı • Sütunlar: Soğutma Hızı • F < Fk , p > 0.05 • Sıfır hipotezini kabul edilir, yani soğutma hızı kristalin elektriksel özelliklerinde anlamlı bir etkiye neden olmamakta