410 likes | 851 Views
İTİCÜ Mühendislik ve Tasarım Fakültesi Endüstri Mühendisliği Bölümü. İSTATİSTİK VE OLASILIK I. 10. Hafta: Örnekleme Teorisi. Öğr. Gör. Berk Ayvaz. 2013. Örnekleme Teorisi.
E N D
İTİCÜ Mühendislik ve Tasarım Fakültesi Endüstri Mühendisliği Bölümü İSTATİSTİK VE OLASILIK I 10. Hafta: Örnekleme Teorisi Öğr. Gör. Berk Ayvaz 2013
Örnekleme Teorisi • Modern istatistiğin en önemli görevi, anakütle parametrelerinin örneklem değerleri (örnek istatistikleri) yardımıyla tahmin edilmesine imkan sağlamaktır. • Uygulamada, bütün anakütlenin incelenmesi çoğu zaman mümkün olmamaktadır. • Bunun yerine söz konusu anakütledenalınan bir rassal örneklemin incelenmesi yoluna gidilmektedir. • Elde edilen örnek değerlerinin anakütle parametresi yerine kullanılabilmesi için iki önemli şart vardır. • Anakütledeki her birimin örneğe girme şansının eşit olmasıdır. • Örneğin yeterince büyük olmasıdır. • Bu ikinci şarta göre anakütle büyüdükçe örneğin de büyük tutulması gerekecektir.
Örnekleme Teorisi • Örnekleme ya iadeli veya iadesiz olur. Çekilen birimin anakütleye tekrar iade edilmesi halinde iadeli örnekleme, aksi halde iadesiz örnekleme söz konusudur. • Herhangi bir anakütle birimi, iadeli örneklemede örneğe bir kaç kere girebileceği halde, iadesiz örneklemede bir kere girer. • Örnekleme ya sınırlı veya sınırsız anakütleleriçin yapılır. • Örneklemenin iadeli olarak yapıldığı sınırlı bir anakütle sınırsız kabul edilir.
Örnekleme Teorisi • Bir anakütleden alınan RASSAL örneklerin her birisi için örnek istatistikleri hesaplandığında örnek dağılımları ortaya çıkar. • Mesela her bir örneğin ortalaması hesaplanmışsa elde edilen dağılımı ortalamaların örnek dağılımıdır. • Aynı şekilde, her örnek için p oranları hesaplandığında oranların örnek dağılımı elde edilmiş olur. • İki ayrı anakütlenin karşılaştırılması sözkonusu olduğunda ise farklarla ilgili örnek dağılımları ortaya çıkar. Her iki anakütleden alınan nA ve nB büyüklüğündeki örneklerin ortalamaları hesaplanmış ve bu ve değerleri arasındaki farklar tesbit edilmişse elde edilen dağılım ortalamalar arası farkların örnek dağılımıdır. • Aynı şekilde, bu anakütlelerden alınan örnekler için oranlar hesaplanmış ve bu oranların anakütleler itibariyle gösterdikleri farklılıklar ortaya konulmuşsa elde edilen dağılım oranlar arası farkların örnek dağılımıdır.
Ortalamaların Örnek Dağılımı • Ortalamaların örnek dağılımının ortalaması anakütleortalamasının iyi bir tahmincisidir. • Herbiri n hacimli çok sayıda örneğe ait ortalamaların gösterdiği dağılımın değişkenliği tek örneğin değişkenliğinden daha az olacaktır. • Ortalamaların örnek dağılımının değişkenliği standart hata terimiyle ifade edilir. • Aşırı değerlerin etkisinin önemli ölçüde yok edilmesi, ortalamaların örnek dağılımının değişkenliğini azaltıcı bir faktördür. • Anakütlestandart sapması biliniyorsa standart sapma (standart hata), • eşitliği ile hesaplanır. Bu formül n • Standart hata ortalamanın örnekleme dağılımınındeğişkenliğini gösterir. • Anakütlestandart sapması bilinmiyor ve büyük örnek standart sapması, anakütle standart sapmasının yerine kullanılıyorsa, anakütle standart hatasının tahmini değeri,
Ortalamaların Örnek Dağılımı • Sınırlı anakütleden iadesiz örnekleme yapılmışsa ve ise yukarıdaki standart hata değerleri düzeltme faktörü ile çarpılır. • Standart Z değerleri, • formülü ile hesaplanır. • Ortalamaların örnek dağılımında X değerlerinin yerini değerinin yerini ve değerinin yerini alır. • Bu yüzden herhangi bir değerinin standart Z değerine dönüştürmesinde aşağıdaki formül kullanılır.
Örnek 1 • Şehirlerarası telefon görüşmeleri = 8 dk ortalama ve = 2 dk standart sapma ile normal dağılım göstermektedir. Tesadüfi olarak 49 şehirlerarası telefon görüşmesi seçildiğinde; • Ortalamaların örnek dağılımının standart hatası ne olur? • Örnek ortalamalarının % kaçı 7.8 dk ile 8.4 dk arasında olur?
Çözüm 1 • = • = =-0.69 = =1.38 Örneklem ortalamalarının 7.8 dk ile 8.4 dkarasında olma ihtimali; P(7.8)=P (-0.69Z1.38) = 0.2549+0.4162=0.6711
Örnek 2 Türktelekomdaçalışanbiroperatörsünüz. Uzunmesafelitelefongörüşmeleri = 8 dk. & = 2 dk. İle normal dağılmakta. Eğer 25 aramalıkörneklerseçersenizörnekortalamalarının % kaçı 7.8 & 8.2 dk. arasındaolacaktır?
Çözüm 2 X 7 . 8 8 Z . 50 n 2 25 X 8 . 2 8 Örneklemedağılımı Z . 50 n 2 25 Standart normal dağılım = .4 = 1 Z X .3830 .1915 .1915 Z 7.8 8 8.2 -.50 0 .50
Örnek 3 Bir sanaayi kuruluşunda çalışanların gündelikleri 800 TL ortalama ve 90 TL standart sapmaya sahiptir. Rasgele seçilen 81 işçinin gündeliklerinin ortalamasının 810 TL ile 825 TL arasında olma olasılığı nedir?
Örnek 4 Bir üreticiye göre rulmanların ömrü ortalaması 36.000 standart sapması 4.000 mil olan bir normal dağılıma uymaktadır. 16 rulman içeren rassal bir örneklemde ortalama ömür 34.500 mildir. Buna göre rassal seçilen bir rulmanın ortalama değerde yada daha düşük ömre sahip olma olasılığı nedir?
Çözüm 4 =1-0,9332=0,0668
Merkezi Limit Teoremi • Birpopulasyonparametresinitahminlemekiçinşansdeğişkenlerikullanılır: • Örnekortalaması, örnekoranı, örnekmedyanı… Örnekhacmiarttıkça(n 30) ... Merkezi Limit Teoremi Örneklemedağılışı normal dağılımayaklaşır.
Merkezi Limit Teoremi • Evrenin dağılım şekli ne olursa olsun, basit rassal örneklem hacmi büyüdükçe, dağılımınınörneklem dağılımınormal dağılımayaklaşır. • Bu dağılımınortalamasıμ, varyansı dir. • Örneklem hacmi n için yeterli büyüklük, kesin olmamakla birlikte uygulamada n 30 birim olarak kabul edilmektedir. • Eğer ortalaması μ ve varyansıolan normal dağılımlı bir evrenden seçilmiş n hacimlik basit bir rassal örneklemin ortalaması ise ‘nın örnekleme dağılımıortalaması μ, varyansı olan bir normal dağılımdır. • rassal değişkenin dağılımı normal olduğunda;
Merkezi Limit Teoremi • Eşitliğiyle standart değişkene dönüştürülür. • Böylece, normal dağılımın özellikleri kullanılarak örneklem aritmetik ortalamasından anakütle aritmetik ortalaması hakkında bilgi üretmek kolaylaşır. • Normal dağılan bir anakütleden, rassal olarak seçilebilecek birbirinden farklı nbirimlik mümkün bütün örneklemlerin seçildiğini, her örneklem içinleri ve onların standart değerlerini hesaplandığını düşünelim. • Değerler aralığı − olan istatistiğin dağılımı (n-1) serbestlik derecesi (sd = n-1) ilet dağılımı adıverilensüreklibirdağılım gösterir ve buistatistik; • Burada; = şeklinde hesaplanır.
Merkezi Limit Teoremi • t dağılımı ortalaması sıfır olan tek modlu ve simetrik bir dağılımdır. • Dağılımın şekli standart normal dağılıma benzer fakat değişkenliği daha büyüktür. • Bu değişkenlik serbestlik derecesi ile ters orantılıdır. • Örneklem hacmi artarken (sd = n-1)büyür, t değerinin hesaplanmasında nin kullanılmasınedeniyle ortaya çıkan değişkenlikküçülür ve t dağılımı standartnormal dağılıma(z dağılımına) yaklaşır.
Örnek 5 Otomobil lastiği üreticisi bir fabrikanın yöneticisi ürettikleri lastiklerin ortalama ömrünü lastiklerin katettiği km olarak tahmin etmek istiyor. Bu amaçla rassal olarak 100 lastik seçilmiş ve bu lastiklerin ortalama ömrünün = 40000 km ve standart sapmasının s=15000 km olduğu tespit edilmiştir. Yönetim, ürettikleri lastiklerin 35000 Km ömürlü olmasını planlamıştır. Bu bilgileri kullanarak; • ’ nın örnekleme dağılımının ortalamasını hesaplayınız. • İstenen tahminlemeyapılırken işlenebilecek hata nedir? • ’ nın standart z değerini hesaplayınız.
Çözüm 5 • E () = μ = 4000 km • n= 100 lastik olduğu için standart hata (n 30 birim) anakütle standart sapması bilinmediği için = = = 150 km • hesaplanır. Üretilen lastiklerin tümünün ömrünü yukarıdaki verilere göre tahminlerken işlenebilecek hata düzeyi 150 km’dir bilgisi elde edilebilir. ==33,3
Oranların Örnek Dağılımı • Oranların örnek dağılımının ortalaması, anakütle oranına eşittir. • Bir örnekten elde edilen oranı p ve anakütle oranını P ile görterirsek, oranların örnek dağılımının standart hatasını, • eşitliği ile elde ederiz. • Sınırlı anakütlelerde yapılan iadesiz örneklemeler için standart hatanın düzeltme faktörü ile çarpılması gerekir. Bir örnek oranının standart Z değeri, • eşitliği ile hesaplanır.
Örnek 6 Büyük bir alış-veriş merkezinde 15 TL’danalışveriş yapan müşterilerin %30’unun kredi kartı kullandığı tesbitedilmiştir. 15 TL’danfazla alışveriş yapan 100 müşteri için oranların örnek dağılımının standart hatasıne olur?15 TL’danfazla alışveriş yapan 100 müşteriden %20 ile %25’inin kredi kartı kullanması ihtimalini bulunuz.
Çözüm 6 • = =0.0458 • = = -2.18 = = -1.09 P(0)=P (-2.18Z-1.09) = 0.4854+0.3621=0.1233
Örnek 7 Bir imalatçı herbiri 100 elektrik ampülünden meydana gelen 1000 koli ampül gönderiyor. Ampüllerin %95 ’i sağlam olduğuna göre kolilerin kaç tanesinde, • 90 taneden az sağlam ampül • 98 veya daha fazla sağlam ampül çıkacağını hesaplayınız.
Çözüm 7 • = =0.0218 100 üründen 90’ı yani p = 0,90 için; = = -2.29 P()=0,011 • p=0,98 için; = = 1.38 P(1.38)=0,0838
Ortalamalar Arası Farkların Örnek Dağılımı • Ortalamalar arasındaki farkın örnek dağılımı sözkonusu olunca dağılımın ortalamasını ve standart hatasını ile gösterebiliriz. • , birinci anakütlenin standart sapmasını; ise ikinci anakütlenin standart sapmasını; birinci anakütle için ömek büyüklüğünü; ise ikinci anakütle için örnek büyüklüğünü ifade ederse, ortalamalar arası farkların ömek dağılımının standart hatası, + Anakütlevaryanslarının bilinmemesi durumunda örneklem varyansları kullanılır.
Örnek 8 İki farklı un fabrikasında paketlenen standart 1 kg’lık un paketleri test edilmiş ve birinci fabrikadan alınan 100 paketin ortalaması 1.03 kg, standart sapması 0.04 kg; ikinci fabrikadan alınan 120 paketin ortalaması 0.99 kg, standart sapması 0.05 kg bulunmuştur. • Anakütlestandart sapmaları bilinmediği için örnek standart sapmalarından hareketle ortalamalar arası farkın standart hatasını bulunuz. • Ortalamalar arasındaki farkın = 0.05 kg’dan fazla olması ihtimalinibulunuz.
Çözüm 8 • + = + = 0.085 • ==1,17 P[() Her iki anakütlenin ortalaması 1 kg olduğu için =0 dır.
Örnek 9 • A ve B firmalarının ürettikleri kabloların ortalama kırılma gücü sırasıyla 200 kg ve 180 kg, standart sapmaları ise 13,5kg ve 9kg’dir. A marka 100 parça kablo ile B marka 50 parça kablo teste tabi tutulduğunda A’nın ortalama kırılma gücünün B’den; • En fazla 17 kg fazla, • En az 15 kg fazla olma olasılığı nedir?
Çözüm 9 • + = + = 1.86 ==-1.61 P[() • == -2.69 P[()
Oranlar Arası FarklarınÖrnek Dağılımı • Bu dağılımın ortalaması ve standart hatası, • eşitliği ile hesaplanır. • Birinci anakütleden alınan örneğin hacmi ve ikinci anakütledenalınan örneğin hacmi ise ile gösterilmiştir. İki örnek oranı arasındaki farka ait Z değerleri, • formülü yardımıyla hesaplanır, p değerleri örneklerden elde edilen oranları gösterir.
Örnek 10 Birinci fabrikadaki kusurlu mamul oranının 0.08 ve ikinci fabrikadaki kusurlu mamul oranının 0.05 olduğu bilinmektedir. Tesadüfi olarak birinci fabrikadan 100, ikinci fabrikadan 150 mamul seçilmiş ve birinci örnekteki kusurlu mamul oranı 0.09, ikinci örnekteki kusurlu mamul oranı 0.06 olarak gözlenmiştir. • Buna göre kusur oranları arasındaki farkın standart hatasını bulunuz. • Fabrikalardaki kusurlu mamul oranları arasındaki farkın en fazla 0.01 olması ihtimalini hesaplayınız.
Çözüm 10 • = • = = -0.62 Buna göre kusurlu mamul oranları arasındaki farkın en fazla 0.01 olması ihtimali, P(Z -0.62) = 0.5 - 0.2324 = 0.2676
Örnek 11 A fabrikasında imal edilen pillerin %80’i 200 saatin üzerinde performans sağlarken, B fabrikasında üretilen pillerin %73’ü 200 saatin üzerinde performans sağlayabilmektedir. A fabrikasından 50 ve B fabrikasından 60 pil incelemeye tabi tutulursa performans oranları arasındaki farkın en az %10 olma ihtimali nedir?
Çözüm 11 • = • = = 0.37 P(Z 0.37) = 0.3557