600 likes | 1.34k Views
İTİCÜ Mühendislik ve Tasarım Fakültesi Endüstri Mühendisliği Bölümü. İSTATİSTİK VE OLASILIK I. 12. Hafta: HİPOTEZ TESTLERİ. Öğr. Gör. Berk Ayvaz. 2013. HİPOTEZ TESTLERİ. Hipotez testi 5 aşamalıdır!.
E N D
İTİCÜ Mühendislik ve Tasarım Fakültesi Endüstri Mühendisliği Bölümü İSTATİSTİK VE OLASILIK I 12. Hafta: HİPOTEZ TESTLERİ Öğr. Gör. Berk Ayvaz 2013
HİPOTEZ TESTLERİ Hipotez testi 5 aşamalıdır! Hipotez testleri örnekten elde edilen istatistikler vasıtasıyla anakütle parametreleri hakkında karar verilmesini sağlar. • Sıfır Ve Alternatif Hipotezlerin Belirlenmesi • Önem Veya Risk Derecesinin Belirlenmesi • Hipotez Testinin Yönünü Belirlemek • Kritik Değeri Veya Değerleri Belirlemek • Test İstatistiğini Belirlemek Ve Kritik Değer İle Karşılaştırmak
HİPOTEZ TESTLERİ • Sıfır Hipotezi ve Alternatif Hipotez • İstatistiksel hipotezlerin testinde, iki hipotez söz konusudur. Bunlar; “sıfır hipotezi” ve “karşıt hipotez (alternatif hipotez)” olarak isimlendirilirler. • Anakütleparametreleri hakkında karar verirken doğru veya yanlış olması muhtemel yargılardan hareket ederiz. • Daha önce doğru olduğu ispatlanan veya ortak kabul görmüş yargılara sıfır hipotezi (H0) denir. • Sıfır hipotezi (H0), ilgili evren parametresinin bilinen değerinde, herhangi bir farklılığın beklenmediğinin ifade edildiği hipotezdir. • H0 hipotezi test edilecek hipotez olduğu için test sonucunda verilecek karar da bu hipoteze ilişkin karar olur. • H0hipotezine ilişkin verilecek karar H0 kabul veya H0 redşeklinde olur.
Sıfır Hipotezi ve Alternatif Hipotez • Sıfır hipotezi tek başına bir mana ifade etmez. • Sıfır hipotezinde belirtilen yargının tersi bir yargıyı içinde bulunduran bir hipotez daha gereklidir. Bu hipoteze alternatif hipotez () denir. • Alternatif hipoteze araştırma hipotezi de denilmektedir.
Sıfır Hipotezi ve Alternatif Hipotez • Örnekten elde edilen istatistikler sıfır hipotezinin yanlış olabileceği yönünde şüpheler doğurabilir. • Bu durumda üç tip alternatif hipotez sözkonusu olur. • Örnek istatistiği, anakütle parametresinin iddia edilen değere eşit olmadığı şüphesini doğurursa, yapılacak test çift kuyruk testidir. • Çünkü anakütle parametresi belirtilen değerden küçük veya büyük olabilir. • Örnek istatistiği, anakütle parametresinin iddia edilen değerden küçük olabileceğini düşündürürse yapılacak test sol kuyruk testidir. • Örnek istatistiği, anakütle parametresinin iddia edilen değerden büyük olduğu şüphesini doğurursa yapılacak test sağ kuyruk testidir. • Örnekten elde edilen istatistiğin kafamızda doğurduğu şüpheye göre alternatif hipotezi ve alternatif hipoteze göre de sıfır hipotezini şekillendiririz. • Test prosedürü gereği sıfır hipotezini reddetmeye, dolayısıyla alternatif hipotezi kabul etmeye çalışırız.
Sıfır Hipotezi ve Alternatif Hipotez • Sıfır hipotezi, “arada fark yoktur” şeklinde kurulur. Örn. • Toplumda kadınlarla erkeklerin sigara içme durumlarını karşılaştırmak istersek kuracağımız H0 hipotezi şöyle olur: • “Toplumda kadınlarla erkeklerin sigara içme sıklıkları arasında fark yoktur” • Alternatif hipotez ise H0’ın doğru olmadığını iddia eder. Yukarıdaki örnekte H1 şöyle olur: • “Toplumda kadınlarla erkeklerin sigara içme sıklıkları farklıdır”
Birinci ve İkinci Tip Hata Sıfır hipotezini reddederken belirli hata payını her zaman göze alırız. Bu hataya, birinci tip hata veya hatası deriz. Bununla birlikte yanlış olan bir sıfır hipotezinin kabul edilmesi riski de vardır. Bu hataya, ikincil hata veya hatası denir. • hatası testin gücünü belirler. • Her iki hatayı birlikte küçültmenin en güvenilir yolu örnek hacmini arttırmaktır. • Birinci ve ikinci tip hata birbiriyle ters orantılı olarak değişir, hatası arttığında hatası azalır. • Bu durumda araştırmacı hangi hatanın daha önemli olduğuna karar vererek, önemli hatayı en aza indirmeye çalışacaktır.
Sıfır Hipotezi ve Alternatif Hipotez Örneği Ders geçmek için gerekli minimum notun ortalama 70 olduğu bir sınıftan seçilen 30 öğrencinin aldığı notların ortalaması 68 olsun. Bu durumda popülasyonun (sınıfın) gerçek ortalaması 70’ın üzerinde midir?
Hipotez Testinin Yönünü Belirleme Alternatif hipotez için yazılan duruma görehipotez testi tek yönlü ya da iki yönlü olabilir.
Kritik Değer Kritik Değer • Sıfır hipotezinin reddedileceği alanı hatası belirler. • Çift kuyruk testi yapılırken hatası ikiye bölünerek normal eğrinin sağ ve sol kuyruğuna eşit olarak yüklenir. • Normal eğrinin her iki ucundaki /2’lik alanların sınırını gösteren iki adet kritik Z değeri vardır. • Bu değerler normal dağılım tablosundaki 0.5 - /2’lik alana karşı gelen ±Z değerleridir. • Test istatistiği bu Z değerleri arasında yer alırsa sıfır hipotezi kabul, aksi halde reddedilir.
HİPOTEZ TESTLERİ • Bununla birlikte tek kuyruk testi yaparken testin yönüne göre hatasının tamamı normal eğrinin sağ veya sol kuyruğuna yüklenir. • Normal dağılım tablosundaki değerine karşı gelen Z değeri kritik Z değeridir. • Testin yönüne göre kritik Z değeri işaret alır. • Aşağıdaki grafiklerden birincisi sol kuyruk testine, İkincisi sağ kuyruk testine aittir.
Test İstatistiği • Test istatistiği, örnek istatistiği ile iddia edilen anakütle parametresi arasındaki farkın anakütle standart hatasına bölünmesiyle elde edilir. • Sıfır hipotezinin reddedilebilmesi için; test istatistiğinin, birinci tip () hatanın belirlediği Z değerinden mutlak değerce daha büyük olması gereklidir. • Anakütlestandart hatası bilinmediğinde, 30’dan büyük örnekler için hesaplanan standart hata, anakütle standart hatasının yerine kullanılabilir.
P Değeri • Tek kuyruk testindeki P değeri, test istatistiğinin ötesine düşen alanı gösterir. • Diğer bir ifadeyle, H0hipotezini reddedebilmek için katlanılması gereken hata seviyesini ifade eder. • Çift kuyruk testinde bu hata ikiye katlanır. • P değeri, göze alınan hatasından küçük olursa Ho hipotezi reddedilir. • Aksi durumda, Ho hipotezi kabul edilerek bulunan farkın tesadüfen ortaya çıktığı varsayılır.
Hipotez Testi Adımları Özet olarak: • H0 ve H1hipotezleri belirlenir • düzeyi tespit edilir • Hipotez testinin yönü belirlenir • Kritik değer z* bulunur • Test istatistiği yapılarak z değeri bulunur ve karşılaştırma ile karar verilir.
Ortalamalarla İlgili Hipotez Testleri Çift kuyruk testi Sol kuyruk testi Sağ kuyruk testi • Ortalamalarla ilgili hipotez testleri yapılırken kurulabilecek muhtemel sıfır ve alternatif hipotezler aşağıda gösterilmiştir. • Ortalamalarla ilgili hipotez testlerine ait test istatistiği, • eşitliğiyle bulunur. • Anakütlestandart sapması bilinmediğinde bunun yerine örnek standart sapması kullanılabilir.
Örnek 1 Bir fakültede not ortalamasının 65 olduğu iddia edilmektedir. Tesadüfi olarak seçilen 49 öğrencinin not ortalaması 60 ve standart sapma 3 bulunmuştur. %1 önem seviyesinde fakülte not ortalamasının 65’ten az olduğunu söyleyebilir misiniz? Sol kuyruk testi
Çözüm 1 şeklinde olduğuna işaret etmektedir. Test, sol kuyruk testi olduğu için = 0.0l’e göre kritik Z değeri normal eğri alanları tablosunda -2.33 değeridir. Örnek hacmi 30’dan büyük olduğu için örnek standart sapmasını anakütle standart sapmasının yerine kullanabiliriz. Test istatistiği, Problemin son kısmı test edilecek hipotez çiftinin; = Buna göre %1 önem seviyesinde Ho hipotezi reddedilerek fakülte not ortalamasının 65’ten küçük olduğuna karar verilir. P(Z < -Zh) = 0.5 - 0.5 = 0
Örnek 2 Bir konserve fabrikasının imal ettiği konservelerin üzerinde brüt 455 gr yazmaktadır. Bu konservelerin brüt ağırlıkları ile ilgili bir karar vermek üzere rastgele seçilen 78 kutunun ortalama ağırlığı 450 gr ve standart sapması 13 gr bulunmuştur. Brüt ağırlığın 455 gr olup olmadığını 0.05 önem seviyesinde test ediniz?
Çözüm 2 Çift kuyruk testi gr • Problemin son kısmı test edilecek hipotez çiftinin şeklinde olduğuna işaret etmektedir. • Test çift kuyruk testi olduğu için = 0.05’e göre kritik Z değeri normal eğri alanları tablosunda 0.5 - 0.05/2 = 0.4750’ye karşı gelen ±1.96 değeridir. • Örnek hacmi 30’dan büyük olduğu için örnek standart sapmasını anakütle standart sapmasının yerine kullanabiliriz. • Test istatistiği, • = olarak hesaplanır. • Kritik Z değeri ve test istatistiğine göre karar modeli aşağıdaki grafikte gösterilmiştir. Buna göre, %5 önem seviyesinde Ho hipotezi reddedilerek fabrikada üretilen konservelerin brüt ağırlığının 455 gr’a eşit olmadığına karar verilir. Bu testin P değeri, P = 2[P(Z < -Zh)] = 2(0.5 - 0.5) = 0 olarak elde edilir.
Oranlarla ilgili hipotez testleri Çift kuyruk testi Sol kuyruk testi Sağ kuyruk testi • Oranlarla ilgili hipotez testleri yapılırken kurulabilecek muhtemel sıfır hipotezi ve alternatif hipotez çiftleri aşağıda gösterilmiştir. • Örnekten hesaplanan oranı p ile gösterirsek ortalamalarla ilgili hipotez testlerine ait test istatistiği, • eşitliğiyle bulunur. • Standart hatanın hesabında anakütle oranı kullanılmadır.
Örnek 5 Yatak çarşafları üreten bir firma, üretimdeki kusur oranının %6 olduğunu bildirmektedir. Bu fabrikadan alışveriş yapmak isteyen bir otel yöneticisi, üretici firmanın imalatından tesadüfi gün ve saatlerde 100 örnek almış ve bunların %10’unun kusurlu olduğunu görmüştür. Sözkonusu yönetici yatak çarşafı imalatının kusur oranının %6’dan fazla olduğunu, %5 önem seviyesinde, söyleyebilir mi?
Çözüm 5 Sağ kuyruk testi • Test sağ kuyruk testi olduğu için = 0.05’e göre kritik Z değeri normal eğri alanları tablosunda 0.5 - 0,05 = 0,45’e karşı gelen 1.645 değeridir. • Test istatistiği, • == 1,68 • Otel yöneticisi, %5 önem seviyesinde, H0 hipotezini reddederek fabrika- daki kusurlu çarşaf oranının %6’dan fazla olduğunu söyleyebilir. P oranı, • P(Z > Zh)] = 0.5 - 0.4535 = 0.0465 olarak hesaplanır.
Örnek 6 Bir süpermarketler zinciri sahibi müşterilerinin %95’ten fazlsınınsüpermarketlerindeki fiyatlardan memnun olduğunu söylemektedir. Rassal olarak seçilen 200 müşteriden 184’ü fiyatlardan memnun olduğunu bildirmektedir. %1 önem seviyesinde, süpermarketlerdeki fiyatlardan memnun olanların %95’e eşit olmadığını söyleyebilir misiniz?
Çözüm 6 Çift kuyruk testi Test, çift kuyruk testi olduğu için = 0.0l’e göre kritik Z değeri normal eğri alanları tablosunda 0.5 - 0.01/2 = 0.4950’e karşı gelen ±2.58 değeridir. Test istatistiği; == -1,95 %1 önem seviyesinde Ho hipotezi kabul edilir. Süpermarketlerin sahibinin söylediği gibi, süpermarketlere gelen müşterilerin %95’inin fiyatlardan memnun olduğu söylenebilir. P oranı, 2[P(Zh < Z)] = 2(0.5 - 0.4744) = 0.0512 olarak hesaplanır. • Test hipotezleri,
Ortalamalar Arası Farkla İlgili Hipotez Testleri • Ortalamalar arası farkla ilgili hipotez testleri yapılırken kurulabilecek muhtemel sıfır hipotezi ve alternatif hipotez çiftleri aşağıda gösterilmiştir. Çift kuyruk testi Sol kuyruk testi Sağ kuyruk testi Ortalamalar arası farkla ilgili hipotez testlerine ait test istatistiği;
Ortalamalar Arası Farkla İlgili Hipotez Testleri • Anakütlevaryanslarıbilinmediğinde bunların yerine örnek varyansları kullanılabilir. • Sıfır hipotezinin doğru olabileceği faraziyesiyle hareket edildiği için formüldeki farkı sıfır kabul edilir. • Böylece test istatistiği, • Sıfır hipotezi örneklerin aynı anakütleden alındığını belirttiği için, tersi ispatlanmadığı sürece, Sı ve S2değerlerinin birbiriyle homojen olduğunu ve bu varyanslar yardımıyla gibi ortak bir varyans hesaplanabileceğini söyleyebiliriz.
Ortalamalar Arası Farkla İlgili Hipotez Testleri • Görüldüğü gibi, bu ortak varyans, iki örnek varyansınm tartılı aritmetik ortalaması alınarak bulunmuştur. • Buna göre, ortalamalar arası farkla ilgili hipotez testlerine ait test istatistiği,
Örnek 8 İki ayrı sendikaya bağlı olarak çalışan sanayi işçilerinin aylık ortalama gelirlerini mukayese etmek isteyen bir iş müfettişi A sendikasından tesadüfi olarak seçtiği 150 işçinin aylık ortalama gelirini 35.5 bin lira ve standart sapmayı 3.4 bin lira, B sendikasından tesadüfi olarak seçtiği 200 işçinin aylık ortalama gelirini 34 bin lira ve standart sapmayı 3.7 bin lira olarak hesaplamıştır. Bu iki sendikaya bağlı olan işçilerin ortalama gelirleri arasındaki farklılığın önemli olmadığını, %5 önem seviyesinde, söyleyebilir misiniz?
Çözüm 8 • Çift kuyruk testine göre = 0.05 önem seviyesindeki kritik Z değeri normal eğri alanları tablosunda 0.5 - 0.05/2 = 0.4750'e karşı gelen ±1.96’dır. • Test istatistiğini hesaplamadan önce ortak varyansı; • Problemin son kısmı test hipotezlerinin, ==12,78 • olarak hesaplarız. Ortak varyans dikkate alındığında ortalamalar arası farkla ilgili hipotez testine ait test istatistiği, ==3,88
Çözüm 8 (devamı) • Test istatistiği ve kritik Z değeri dikkate alındığında karar modeli aşağıdaki gibi olur. • %5 önem seviyesinde Ho hipotezi reddedilerek sözkonusu sendikalara bağlı olarak çalışan işçilerin aylık ortalama gelirleri arasındaki farkın önemli olduğuna karar verilir. • P değeri, 2[P(Z > 3.88)] = 2(0.5 - 0.49995) = 0.0001 ’dir.
Örnek 9 Aynı faaliyet kolunda üretim yapan fabrikaların birincisinden tesadüfi olarak seçilen 80 mamulün ortalama dayanma süresi 135 gün ve standart sapması 15 gün; İkincisinden alman 95 mamulün ise ortalama dayanma süresi 130 gün ve standart sapması 18 gündür. %1 önem seviyesinde, birinci fabrikada üretilen mamullerin ortalama dayanma süresinin daha fazla olduğunu söyleyebilir misiniz?
Çözüm 9 Sağ kuyruk testi • Tek kuyruk testine göre = 0.01 önem seviyesindeki kritik Z değeri normal eğri alanları tablosunda 0.5 - 0.01 = 0.4900’a karşı gelen 2.33 değeridir. • Ortak varyans, ==278,74 ==1,97 %1 önem seviyesinde, H0 hipotezi kabul edilerek, birinci fabrikada üretilen mamullerin ortalama dayanma süresinin diğerinden daha fazla olmadığına tarar verilir. P değeri, P(Z > 1.97) = 0.5 - 0.4756 = 0.0244’tür.
Oranlar Arası Farkla İlgili Hipotez Testleri Çift kuyruk testi Sol kuyruk testi Sağ kuyruk testi • Oranlar arası farkla ilgili hipotez testleri yapılırken kurulabilecek muhtemel sıfır hipotezi ve alternatif hipotez çiftleri aşağıda gösterilmiştir. eşitliğiyle bulunur.
Oranlar Arası Farkla İlgili Hipotez Testleri • Anakütle oranları bilinmediğinde bunun yerine örnek oranlan kullanılabilir. • Sıfır hipotezinin doğru olabileceği faraziyesiyle hareket edildiği için test istatistiği formülündeki Pı - P2 farkı sıfır kabul edilir. • Böylece test istatistiği • gibi daha basit bir hale dönüşür. • Sıfır hipotezi örneklerin aynı anakütleden alındığım belirttiği için, tersi ispatlanmadığı sürece, p1 ve p2 değerlerinin birbiriyle homojen olduğunu ve bu oranlar üzerinden, • gibi ortak bir oran hesaplanabileceğini söyleyebiliriz. Görüldüğü üzere bu ortak oran iki örnek oranının tartılı aritmetik ortalaması alınarak bulunmuştur.
Oranlar Arası Farkla İlgili Hipotez Testleri • Nihayet ortak oran dikkate alındığında oranlar arası farkla ilgili hipotez testlerine ait test istatistiği,
Örnek 11 Bir firma yöneticisi firmasına ait iki mağazadan müşterilerinin memnuniyet derecelerini mukayese etmek istemektedir. Yaptığı araştırmaya göre, 300 kişiden 249’u A mağazasından, 400 kişiden 348’i B mağazasından memnundur. %1 önem seviyesinde, müşterilerin memnuniyet dereceleri arasında Önemli bir farklılığın olduğunu söyleyebilir misiniz?
Çözüm 11 • Çift kuyruk testine göre = 0.01 önem seviyesindeki kritik Z değeri normal eğri alanları tablosunda 0.5 - 0.01/2 = 0.4950’e karşı gelen ±2.58 değeridir. • Ortak oran; • = =0,85 • Ve test istatistiği; • == -1,47 %1 önem seviyesinde Ho hipotezi kabul edilerek iki mağazadaki Müşterilerin memnuniyet dereceleri arasındaki farkın anlamlı olmadığına karar irilir. P değeri, 2[P(Z < -1.47)] = 2(0.5 - 0.4292) = 0.1416’dır.
Örnek 12 Bir video kaset kiralayıcısı macera filmi kiralamanın yöredeki erkek ve kadınlar itibariyle farklılık gösterip göstermediğini merak etmektedir. Sözkonusu şahıs belli bir zaman periyodu içerisinde dükkanına gelen 60 erkekten 51’inin ve 40 kadından 20’sinin macera filmi kiraladığını müşahede etmiştir. Bu verilere göre yöredeki erkeklerin kadınlardan daha fazla macera filmi kiraladığını %5 önem seviyesinde söyleyebilir misiniz?
Çözüm 12 Sağ kuyruk testi • Problemin son kısmı kurulacak hipotez çiftinin, Sağ kuyruk testine göre =0.05 önem seviyesindeki kritik Z değeri normal eğri alanları tablosunda 0.5 - 0.05 = 0.4500’e karşı gelen 1.645 değeridir. Ortak oran: = =0,71 Ve test istatistiği; == 3,78 %5 önem seviyesinde Ho hipotezi reddedilerek yöredeki erkeklerin kadınlardan daha fazla macera filmi kiraladığına karar verilir. P(Z > 3.78) = 0