280 likes | 666 Views
Çok Örneklem Cucconi Testi ve Bir uygulaması. Mutlu Umaroğlu. UBK 16 – Antalya Çolaklı 10-12 Eylül 2014. Giriş. Grup karşılaştırması yapan testler en önemli istatistiksel yöntemlerden biridir. Bu testler sadece konum parametresini test eder.
E N D
Çok Örneklem Cucconi TestiveBir uygulaması Mutlu Umaroğlu UBK 16 – Antalya Çolaklı 10-12 Eylül 2014
Giriş Grup karşılaştırması yapan testler en önemli istatistiksel yöntemlerden biridir. Bu testler sadece konum parametresini test eder. Ölçek parametresini karşılaştıran çeşitli testler de vardır. Çoğu çalışmada konum parametresi test edilmesine rağmen bazı tür çalışmalarda hem konum hem de ölçek parametrelerinin test edilmesine gerek duyulur.
Giriş Biyomedikal, biyoinformatik, iklim dinamikleri, finans gibi alanlardaki bazı çalışmalarda konum ve ölçek parametresinin değişimi birlikte incelenmelidir. Tıpta tedavi sürerken ortalama ve değişkenliğin her ikisinin birden değişmesi önemli rol oynayabilir. Örneğin diyabet tedavisinde glikoz düzeyinin hem ortalama hem de değişkenlik açısından farklılaşması önemli olabilir.
Giriş Bu tür durumlarla ilgili ilk kez Tukey 1959’da yeni bir yöntem üzerine çalışmıştır. Ancak bu yöntemde güçten kayıp söz konusudur. Konum ve ölçek parametresini eşanlı olarak inceleyen testler: Cucconi(1968), Lepage(1971), Podgor-Gastwirth(1994), Neuhäuser(2000), Zhang(2006) ve Murakami(2007).
Lepage Testi • Konum ve ölçek parametresinin değişimini eş anlı olarak inceleyen testler içinde en bilinenidir. • İki örneklem konum-ölçek testi olarak konum parametresini inceleyen Wilcoxon testi ve ölçek parametresini inceleyen Ansari-Bradley testinin kombinasyonundan oluşur.
Lepage Testi n çift W: AB: E: V: n tek Wilcoxon test istatistiği Ansari-Bradley test istatistiği Beklenen değer Varyans
Cucconi Testi Eş anlı olarak konum ve ölçek parametresini test eder. İlk kez 1968 yılında önerilmiştir ancak Cucconi testi İtalyan yerel yayınında yayımlandığı için az bilinmektedir. 2009’dan bu yana Marozzi bu yöntem üzerine çalışmaktadır.
Cucconi Testi • Marozzi, • Cucconi testi üzerine çalışmış ve ilk defa exact kritik değerler tablosunu oluşturmuştur (Cucconi asimptotik kritik değerler tablosu). • Tip Ihata olasılığı ve güç üzerine de çalışmıştır. • Çok örneklem Cucconi testini oluşturmuştur.
Cucconi Testi • Cucconitesti ile ilgilenilmeye başlanmasının temel nedenleri: • Lepage testinden önce yayınlanması • Konum testlerinin ve ölçek testlerinin birleştirilmesinden oluşturulmaması • Lepage testi ile karşılaştırıldığında güç ve test istatistiğinin analitik olarak hesaplamasında sorun çıkmaması • Test istatistiğini hesaplamanın diğer yöntemlere göre daha kolay olması
Cucconi Testi Test Hipotezi: Cucconitest istatistiği
Çok Örneklem Lepage Testi İkiden fazla grup için konum ve ölçek parametresinin eşanlı değişimini inceleyen testler içinde en bilinenidir. Wilcoxon ve Ansari-Bradleytestinin birleşiminden oluşur. Benzer amaçla geliştirilmiş Murakami MH1 ve MH2 testi de vardır. Bu testler de Lepage tipi testlerdir.
Çok Örneklem Lepage Testi Test istatistiği:
Çok Örneklem Cucconi Testi Cucconi testi iki grup için eşanlı olarak konum ve ölçek parametresini test etmektedir. Marozzi, Cucconi testi üzerinde çalışmış ve bu testi ikiden çok grup için genelleyen yeni bir yöntem geliştirmiştir. 2013’de geliştirilen bu yönteme göre ikiden çok grup için eşanlı olarak konum ve ölçek parametresini test etmek mümkündür.
Cucconi Testi Çok Örneklem Cucconi Testi Test Hipotezi: Test istatistiği: • Test Hipotezi: • Test istatistiği:
Çok Örneklem Cucconi Testi Test istatistiği:
Çok örnek Cucconi Testi µ1>µ2 ve σ1=σ2 olduğunda daha büyük olma eğilimindedir. Böylece U1 0’dan büyük olma V1 0’dan küçük olma eğilimindedir. µ1<µ2 olduğunda tam tersi doğrudur. µ1=µ2 ve σ1>σ2 olduğunda daha büyük olma eğilimindedir. Böylece U1 0’dan büyük olma eğilimindedir.
Çok Örneklem Cucconi Testi Çok örneklem Cucconi Testi bir permutasyon testidir ve P değeri permutasyonüzeriden hesaplanır. Permütasyon sayısı MC test istatistiğini etkilenmez sadece P değeri üzerinde etkilidir. Permutasyon testini uygularken çok örneklem Cucconi test istatistiğinin asimptotik dağılımı önemli değildir.
Çok Örneklem Cucconi Testi Gözlenen verilerden MC istatistiği hesaplanır ve MC0 olarak atanır Örneklemler birleştirilir (X=(X1,X2,…,Xk)) ve birleştirilmiş örneklemden rasgele olarak örnek seçilerek MC istatistiği hesaplanır ve MC1 olarak atanır 2. adım B kez tekrarlanır (MC2, MC3,…,MCB) Kestirilen P değeri α’dan küçük veya eşitse H0 hipotezini reddedilir
Örnek 54 yiyecek firmasının sattığı bir et ürünündeki sodyum değerleri miligram cinsinden aşağıda verilmiştir. Bu ürün içerdiği et türüne göre (kırmızı et, beyaz et ve domuz eti) sınıflandırılmıştır. Bu sınıflar arasında konum-ölçek parametresi bakımından anlamlı bir farklılık var mıdır?
Tartışma - Sonuç Geleneksel yöntemlerde konum-ölçek probleminin çözümünde konum testi ve ölçek testinin birleşiminden yararlanılır. MC testinde test istatistiği sadece ranklar üzerinden hesaplanır. Yokluk hipotezi doğru ise test istatistiğinin 0’a yakın olması beklenir. Eğer en az iki dağılım fonksiyonu farklı konum-ölçek parametresine sahip ise test istatistiği 0’dan farklıdır. Dağılımların farkı arttıkça test istatistiği büyür.
Tartışma - Sonuç MC test istatistiği yeniden örnekleme temelli yöntemler kullanılarak analitik olarak hesaplanabilir. Hesaplamalarda kullanılan iki önemli etken Tip I hata ve güçtür. MC testi asimptotik dağılımlardan bağımsız herhangi bir veri setine uygulanabilir. MC istatistiği Uk ve Vk arasındaki Mahalanobis uzaklığının yarısının ortalamasına eşittir.
Kaynaklar Marozzi M., TheMultisampleCucconi Test, Statistical Methods & Applications, Wiley, 2014 Bonnini S., Corain L., Marozzi M., Salmaso L., NonparametricHypothesisTesting: RankandPermutationMethodswith Applications in R ISBN: 978-1-119-95237-4, Wiley, 2014 Marozzi M., SomeNotes on theLocation-ScaleCucconi Test, Journal of NonparametricStatistics, 2009 Marozzi M., NonparametricSimultaneousTestsforLocationandScaleTesting: A comparison of SeveralMethods, 2013 Marozzi M., A ModifiedCucconi Test forLocationandScaleChangeAlternatives, 2013 Lepage Y., A combination of Wilcoxon'sand Ansari-Bradley'sstatistics, Biometrika, 1971 Rublik F., Themultisampleversion of TheLepage Test, Kybeynetika,2005 Neuhauser M. Leuchs A., Ball D., A newLocation-Scale test based on a combination of theideas of LeveneandLepage, BiometricalJournal, 2011
R Kodları MultiSampleCucconiTest <- function(pooled.sample, sample.sizes, B){ # Outer function: Inner fonksiyon yardimiylapermutasyonadayali test istatistiğini hesaplar # Argumanlar: # pooled.sample: birlestirilmisorneklem # sample.sizes: orneklemgenisligivektoru # B: permutasyonsayisi # Ciktilar: # mc.test[1]: MC test istatistigi # mc.test[2]: MC testinin p degeri MultiSampleCucconiStat <- function(pooled.sample, sample.sizes){ # Inner function: MC test istatistiğini hesaplar # Argumanlar: # pooled.sample: birlestirilmisorneklem # sample.sizes: orneklemgenisligivektoru # Ciktilar: # MC test istatistigi sample.sizes <- c(0, sample.sizes) n <- sum(sample.sizes) K <- length(sample.sizes) ranks <- rank(pooled.sample) contrary.ranks <- n+1-ranks groups.ranks <- vector("list", K-1) groups.contrary.ranks <- vector("list", K-1) cum.sample.sizes <- cumsum(sample.sizes) for (k in 1:(K-1)){ groups.ranks[[k]] <- ranks[(cum.sample.sizes[k]+1):(cum.sample.sizes[k+1])] groups.contrary.ranks[[k]] <- contrary.ranks[(cum.sample.sizes[k]+1):(cum.sample.sizes[k+1])] } sample.sizes <- sample.sizes[2:length(sample.sizes)] means <- vector(, K-1) st.dev <- vector(, K-1) for (k in 1:(K-1)){ means[k] <- sample.sizes[k]*(n+1)*(2*n+1)/6 st.dev[k] <- (sample.sizes[k]*(n-sample.sizes[k])*(n+1)*(2*n+1)*(8*n+11)/180)^0.5 } covariance <- -(30*n+14*n^2+19)/(8*n+11)/(2*n+1) u.stat <- vector(, K-1) v.stat <- vector(, K-1) partial.c.stat <- vector(, K-1) for (k in 1:(K-1)){ u.stat[k] <- (sum(as.vector(groups.ranks[[k]])^2)-means[k])/st.dev[k] v.stat[k] <- (sum(as.vector(groups.contrary.ranks[[k]])^2)-means[k])/st.dev[k] partial.c.stat[k] <- (u.stat[k]^2+v.stat[k]^2-2*u.stat[k]*v.stat[k]*covariance) /2/(1-covariance^2) } c.stat <- mean(partial.c.stat) return(c.stat) } # inner fonksiyon sonu mc.test <- vector(, 2) permutation.cucconi.stat <- vector(, B) for (b in 1:B){ pooled.sample.perm <- sample(pooled.sample) permutation.cucconi.stat[b] <- MultiSampleCucconiStat(pooled.sample.perm,sample.sizes) } mc.test[1] <- MultiSampleCucconiStat(pooled.sample, sample.sizes) mc.test[2] <- length(permutation.cucconi.stat[permutation.cucconi.stat >= mc.test[1]])/B return(mc.test) }
Teşekkürler mutlu.umaroglu@hacettepe.edu.tr