1 / 39

ANOVA ANALİZİ & KÜMELEME ANALİZİ THY UYGULAMASI

ANOVA ANALİZİ & KÜMELEME ANALİZİ THY UYGULAMASI. Hazırlayanlar: Gülcan İzmir Aysel Sarı Cenk Aydın. Mayıs 09. ANOVA – VARYANS ANALİZİ. T-testi ile iki ortalamanın karşılaştırmasını yapılır.

ann
Download Presentation

ANOVA ANALİZİ & KÜMELEME ANALİZİ THY UYGULAMASI

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ANOVA ANALİZİ & KÜMELEME ANALİZİTHY UYGULAMASI Hazırlayanlar: Gülcan İzmir Aysel Sarı Cenk Aydın Mayıs 09

  2. ANOVA – VARYANS ANALİZİ • T-testi ile iki ortalamanın karşılaştırmasını yapılır. • İkiden fazla kitle ortalaması arasında fark olup olmadığının test edilmesi için ise Anova analizi kullanılır. • H0: µ1 = µ2 =…= µk (Yani ortalamalar arasında fark yoktur.) • H1 : ortalamalardan en az ikisi arasında anlamlı fark vardır.

  3. ANOVA – VARYANS ANALİZİ • Varyans analizinde de bağımlı ve bağımsız değişkenler bulunur. Bağımsız değişkenlerin, bağımlı değişken üzerindeki etkisi araştırılır. • Kullanılan yöntemler:

  4. ANOVA – VARYANS ANALİZİ Gerekli parametreler: • Toplam örnek gözlem sayısı • Bütün gözlemlerin ortalaması

  5. ANOVA – VARYANS ANALİZİ Gerekli parametreler: • Kareler toplamı: 1. Gruplar arası kareler toplamı (within groups) MST = Mean Square Between Groups = SST (sum of squares)df ( number of groups -1)

  6. ANOVA – VARYANS ANALİZİ Gerekli parametreler: • Kareler toplamı: 2. Grup içi kareler toplamı (between groups) MSE = Mean Square Within Groups (MS error) = SSE (sum of squares within groups) df ( total sample size –no. of groups)

  7. ANOVA – VARYANS ANALİZİ • MST ve MSE değerleri ile 2 varyans tahmini elde edilir. • Ho doğru ise bu iki değer de yaklaşık eşit olmalıdır. • Ho doğru değilse; MST, MSE’den büyük olmalıdır. • F değeri hesaplanır: • F = MST MSE • F dağılım tablosundan serbestlik derecesi değerlerine göre CVF değeri bulunur. • Eğer F > CVF ise Ho red edilir. • Yani ortalamalar arasında • farklılık yoktur.

  8. SORU: 9 THY yolcularının yaş gruplarını (v9) dikkate alarak beklentilere yönelik hizmet kalitesine ait (v601) ve (v602) değişkenlerini ANOVA analizi ile test ediniz. İkili karşılaştırmaları Scheffe ile yaparak sonuçlarını yorumlayınız. (v601): Modern ekipmana sahip olmalıdır. (v602): Uçakların iç ve dış görünümü çekici olmalıdır.

  9. Sosyo- demografik özellikler Beklenen hizmet Algılanan hizmet kalitesi Tatmin Tüketim Alışkanlıkları Algılanan hizmet ARAŞTIRMA MODELİ Yaş grubu ile Uçakların iç-dış görünümünün çekici olmasına yönelik beklenti. Tüketicilerin sosyo-demografik özellikleri ve tüketim alışkanlıkları

  10. AMAÇ: Yaş grupları arasında (demografik özellik) beklenen hizmet kalitesinde fark olup olmadığını inceleyeceğiz. 6 tane yaş grubunun (v601) ve (v602) değişkenlerindeki ortalamaları karşılaştırılacağı için tek yönlü varyans analizini kullanacağız.

  11. HİPOTEZ: Ho: “Modern ekipmanlara sahip olmalıdır” ifadesine verilen cevaplar açısından yaş grupları arasında bir farklılık yoktur. µ1 = µ2 =…= µ6 H1 : “Modern ekipmanlara sahip olmalıdır” ifadesine verilen cevaplar açısından yaş grupları arasında bir farklılık vardır. Ho: “Uçakların iç ve dış ekipmanları çekici olmalıdır” ifadesine verilen cevaplar açısından yaş grupları arasında bir farklılık yoktur. µ1 = µ2 =…= µ6 H1 : “Uçakların iç ve dış ekipmanları çekici olmalıdır” ifadesine verilen cevaplar açısından yaş grupları arasında bir farklılık vardır.

  12. SST= 25(4,48-4,66)2 + …+ 14(5-4,66) 2 = 2,450 df = grup sayısı -1 = 6-1 = 5 MST= SST / df =2,450 / 5 = 0,490

  13. SSE= 137,981 df = N –grup sayısı = 511-6 = 505 MSE = SSE / df =137,981 / 505 =0,273

  14. F = MST / MSE = 0,490 / 0,273 = 1,793 F dağılımı (5, 505)

  15. % 95 güven aralığı; F (5, 505) için F dağılımı tablosuna bakarsak; 2,21

  16. Ho red alanı Ho kabul alanı 2,21 Ho: “Modern ekipmanlara sahip olmalıdır” ifadesine verilen cevaplar açısından yaş grupları arasında bir farklılık yoktur. µ1 = µ2 =…= µ6 1,793 F dağılımı (5, 505) = 2,21 Ho kabul edilir

  17. F = MST / MSE = 1,613 / 0,538 = 2,995 F dağılımı (5, 505)

  18. H1 : “Uçakların iç ve dış ekipmanları çekici olmalıdır” ifadesine verilen cevaplar açısından yaş grupları arasında bir farklılık vardır. Ho red alanı Ho kabul alanı 2,21 2,995 Ho red, H1 kabul edilir. F dağılımı (5, 505) = 2,21

  19. Bu örnekte; tek yönlü ANOVA (Varyans Analizi) yapılmıştır. İki bağımlı değişkenlerin her biri ayrı ayrı bağımsız değişken ile analize girmiştir bundan dolayı sonuçlar da ayrı ayrı değerlendirilmelidir. • Burada tek yönlü MANOVA’ da yapılabilirde ama o zaman bağımlı değişkenler birlikte gözetilerek, bağımsız değişken ile analize tabi tutulmuş olurdu. • Descriptes tablosuna baktığımızda 0.05 güven aralığı ile çalışıldığı görülmektedir. Bunun için ANOVA tablosundaki “significant değeri” 0.05 ile karşılaştırılır yada “Ft” değerleri bulunarak ANOVA tablosundaki “F” değerleri ile karşılaştırılır. Sonuçlar:

  20. Sig= 0.113 > 0.05 Ho kabul FT 5, 505;0.05=2.21>1.79= FH Ho Kabul Grup ortalamaları arasında fark yok. Yaş gruplarına göre bir uçağı modern ekipmana sahip olması değişmemektedir. • Sig= 0.011< 0.05 Ho red FT 5,505;0.05 =2.21<2.995=FH Ho red Grup ortalamaları arasında fark var. Uçakların iç ve dış görünümünün çekici olması yaş gruplarına göre farklılık göstermektedir. Peki farklılık hangi grup ya da gruplardan kaynaklanıyor? Scheffe yöntemi ile tek tek eşleştirmeleri inceleyerek bu farklılığın anlamlı bir farklılık olup olmadığına bakacağız. Ortalamalar arasındaki farkı F tablosunu da kullanarak kıyaslayacağız.

  21. Örn; 18-24 yaş için ort 3,76 iken Bu ortalamanın diğer ortalamalardan farkı hesaplanır

  22. Anlamlılık düzeyine baktığımızda; tüm değerler 0,05’ten büyük olduğu için gruplar arasında anlamlı bir farkın olmadığı görülür.

  23. Sig= 0.725 > 0.05 bu iki yaş grubu arasında önemli bir farklılık gözlenmediği söylenir. • Tablo incelendiğinde yaş bağımsız değişkenlerinde, her iki bağımlı değişken için ortalamalar arası farklar anlamlı çıkmamıştır. • Uçakların iç ve dış görünümünün çekiciliği gruplara göre ANOVA’da farklılık gösterse de hangi gruptan kaynaklandığı görülmemiştir çünkü Scheffe’ye göre gruplar arasındaki fark %95 anlamlılık düzeyinde anlamlı değildir. Sonuçlar:

  24. Homogeneous Subsets Alt Grup Tablosuna da baktığımızda alt gruplara ayrılma yapılmadığını yani grupların modern ekipmana sahip olma ve uçakların iç ve dış görünümünün çekici olması konusunda benzer özellik gösterdiğini tekrardan görmekteyiz. • Scheffe ile tek tek eşleştirmeler incelendiğinde, “Uçakların iç ve dış ekipmanları çekici olmalıdır” ifadesi için gruplar arası anlamlı bir farklılık %95 güven aralığında gözlenmemektedir.

  25. KÜMELEME ANALİZİ - Cluster Analysis • Gruplanmış verileri birey ya da nesnelere temel özelliklerine dikkate alarak sınıflandırmada sıklıkla kullanılan çok değişkenli istatistiksel bir yöntemdir. • Kümeleme analizi bize özetleyici bilgileri sunmaktadır. • Analiz sonucunda oluşan kümeler arasında heterojenlik, kümelerin kendi içlerinde homojenliği yüksektir.

  26. Kümeleme analizinde değişkenler bağımlı ve bağımsız olarak ikiye ayrılmamaktadır. • Kümeleme analizi şunlar için kullanılabilir; • Bir araştırmada gözlem sayımız çok fazla olduğu zaman kümeleme sayesinde analizin yapılmasını ve verilerin yorumlanmasını kolaylaştırır. • Bazen araştırmacılar varsayım geliştirmek ya da varsayımlarını önceden test etmek istediklerinde kullanırlar. KÜMELEME ANALİZİ - Cluster Analysis

  27. SORU: 10 THY verilerini dikkate alarak faktör analizi sonucu elde edilen boyutlara göre ((Güvenilir1), (Müsteri1), (Anindahizmet1), (Güventelkinetme1), (Fizikiunsurlar1)) kümeleme analizini yapınız. Kümeleme analizinde k-ortalamalar yöntemini (k=3) kullanınız. Elde edilen kümelerin faktörler itibariyle farklılıklarının anlamlı olup olmadığını LSD (Least Significance Difference) testi ile inceleyerek yorumlayınız.

  28. Sosyo- demografik özellikler Beklenen hizmet Algılanan hizmet kalitesi Tatmin Tüketim Alışkanlıkları Algılanan hizmet ARAŞTIRMA MODELİ Tüketicilerin sosyo-demografik özellikleri ve tüketim alışkanlıkları

  29. Hizmet algısını ölçmek için hazırlanan değişkenleri Faktör analizi ile 5 faktörde toplamıştık. Bu faktörlere kümeleme analizi uygulayıp benzer özellik gösterenleri belirleyeceğiz ve küme farklılıklarının anlamlı olup olmadığına bakacağız. AMAÇ: Faktörler: 1-Güvenilir ve doğru hizmet, 2-müşteriyi tanıma ve anlama, 3-anında hizmet, 4-güven telkin etme, 5-fiziki unsurlar. 29

  30. İlk kümeleme merkezi; Üç kümeleme olduğu belirtildiği üzere • Tekrarlamayı Running Means seçsek de 5 tekrarlamada 3 kümelenin oluştuğunu görülmekte. • Değerler neredeyse sıfır artık bu değişim bitti demektir.

  31. Final Cluster Centers tablosuna baktığımızda, 5 değişkenin 3 kümedeki ortalamalarını verdiğini görüyoruz. • Bütün bu değişkenlerden en çok zevk alan 1. kümedir • Her kümeye isabet eden gözlem sayısını vermektedir. • Kümeye 161 gözlem • Kümeye 213 gözlem • Kümeye 137 gözlem

  32. ANOVA’da bütün değişkenlerin sig değerleri 0.05’ten küçük olduğu için Ho red yani kümelerin ortalamalar arası farkı anlamlıdır diyoruz. Zaten kümeleme ile bu fark kendiliğinden gelir, kümeler arası fark max yapılarak 3 kümeye indirgenmiştir. FT 2.508;0.05= 3 bu değer bütün FH’lardan küçük olduğu için Ho red edildiği buradan da söylenir.

  33. Grupların tanımlayıcı istatistikleri:

  34. 1. Sig =0.000> 0.05 Ho red FT 2.508;0.05=3 < FH=186.665 Ho red 2,3,4,5 içinde aynı şeyler yapılır Ho red sonucu çıkar.

  35. Sonuçlar: • Güvenilir ve doğru hizmette sınıflar arası fark anlamlıdır. • Müşteriyi tanıma anlama için sınıflar arası fark anlamlıdır. • Anında hizmet için sınıflar arası fark anlamlıdır. • Güven Telkin Etme için sınıflar arasındaki fark anlamlıdır. • Fiziki unsurlar için sınıflar arası fark anlamlıdır.

  36. Çoklu karşılaştırma tablosu

  37. SONUÇLAR: • Güvenilirlik ve Doğru Hizmet için 1. ve 2. grup arasında fark 1-2= I-J= 0.36724’tür. Sig= 0.049 <0.05 Bu iki grup arasında farklılık olduğu söylenir. Zaten SPSS programı aralarında farklılığın olduğu gruplara “*” işareti koymuştur. Güvenilirlik ve Doğru Hizmet için bütün gruplar birbirinden farklıdır. • Müşteriyi Tanıma ve Anlama değişkeni için 1. grup 2.ve 3. gruptan farklılık göstermektedir. • Anında Hizmet değişkeni için farklılığı gösteren 3. gruptur. • Güven Telkin Etme değişkeni için farklılığı gösteren 3. gruptur. • Fiziki unsurlar değişkeni için bütün gruplar birbirinden farklılık göstermektedir.

  38. Nihai Küme Merkezleri sonucu, genel olarak, değişkenlere sırasıyla 1, 2, 3 daha fazla önem vermektedir. (1>2>3) • ANOVA’da en yüksek değeri “Müşteriye Yakınlık” değişkeni aldığı için, bu özellik bakımından kümelemedeki ayrışmanın (birbirinden uzaklığın) diğerlerine kıyasla daha fazla olduğu görülmektedir. • ANOVA sonucu tüm kümelerin birbirinden p=0.05 düzeyinde ortalamalar bakımından farklı oldukları görülmektedir. (H0 red: En az bir değişken diğerlerinden farklıdır) • Daha detaylı bilgi için LSD yapılarak, hangi kümelerin değişkenler bazında birbirinden farklı olduğuna bakılır. • Sonuç olarak “Hizmet ve Uçak Kalitesi” bakımından 1. ve 2. kümeler hariç diğer tüm kümelerin ortalamalarının farklı olduğu sonucuna varılır.

  39. Teşekkürler… Hazırlayanlar: Gülcan İzmir Aysel Sarı Cenk Aydın

More Related