1.12k likes | 1.74k Views
OLASILIK ( 6B MHMAU102). Bölüm 6 Tahmin. Güven Aralığı. Bu bölümün içeriği : Pop ü la sy on (Ana Kütle) Ortalaması , μ için Güven Aralıkları Pop ü la sy on Var y an sı σ 2 bilindiğinde Pop ü la sy on Var y an sı σ 2 bilinmediğinde
E N D
OLASILIK (6BMHMAU102) Bölüm6 Tahmin Yrd. Doç. Dr. İmran GÖKER
Güven Aralığı Bu bölümün içeriği: • Popülasyon (Ana Kütle)Ortalaması, μiçin Güven Aralıkları • Popülasyon Varyansıσ2bilindiğinde • Popülasyon Varyansıσ2bilinmediğinde • Popülasyon (Ana Kütle) orantısı, için Güven Aralıkları (büyük örnekler) • Bir normal popülasyonun varyansı için Güven Aralığı Tahminleri Yrd. Doç. Dr. İmran GÖKER
Tanımlar • Bir ana kütle parametresinintahmin edicisi • örneklem bilgilerine dayanan rassal bir değişkendir. • bu bilinmeyen parametreye bir yaklaşık değer sağlamaktadır • Bu rassal değişkenin spesifik bir değeri tahmin olarak anılmaktadır Yrd. Doç. Dr. İmran GÖKER
Nokta ve Aralık Tahminleri • Birnokta tahmini tek bir sayıdır, • bir güven aralığı değişkenlik hakkında ilave bilgi vermektedir Üst Güven Sınırı Alt Güven Sınırı Nokta Tahmini Güven Aralığı genişliği Yrd. Doç. Dr. İmran GÖKER
Nokta Tahminleri Bir Ana kütle (popülasyon) Parametresini… Bir Örneklem İstatistiği ile tahmin ederiz(bir Nokta Tahmini) μ x Ortalama Orantı P Yrd. Doç. Dr. İmran GÖKER
Sapmasızlık • Eğer örneklem dağılımının beklenen değeri veya ortalaması ise parametresinin bir sapmasız tahmin edicisi olarak tanımlanmaktadır, • Örnekler: • Örneklem ortalaması μ’nün bir sapmasız tahmin edicisidir • Örneklem varyansı s2 σ2’ bir sapmasız tahmin edicisidir • Örneklem orantısı P’ninbir sapmasız tahmin edicisidir Yrd. Doç. Dr. İmran GÖKER
Sapmasızlık (devam) • sapmasız bir tahmin edicidir, sapmalıdır: Yrd. Doç. Dr. İmran GÖKER
Sapma • ’nın bir tahmin edicisi olmak üzere • ‘da sapmaonun ortalaması ve arasındaki fark olarak tanımlanmaktadır ve aşağıdaki gibi ifade edilir • Sapmasız bir tahmin edicinin sapması 0’dır Yrd. Doç. Dr. İmran GÖKER
En Etkin Tahmin Edici • ’nın birkaç sapmasız tahmin edicilerinin olduğunu varsayınız. • ‘nınen etkin tahmin edicisi veya minimum varyans sapmasız tahmin edicisi en küçük varyanslıtahmin edicisidir • ve ’nın aynı gözlem sayısına dayanan iki sapmasız tahmin edicisi olmak üzere, bu durumda • Eğer ise ‘in ‘ye göre daha etkin olduğu söylenmektedir • ‘in ’ye göre göreli etkinliği, onların varyanslarının oranıdır: Yrd. Doç. Dr. İmran GÖKER
Güven Aralıkları • Bir ana kütle parametresinin nokta tahmini ile ne kadarlık bir belirsizlik ilişkilidir? • Bir aralık tahmini bir nokta tahminine göre bir ana kütle karakteristiği hakkında daha fazla bilgi temin etmektedir • Böyle aralık tahminleri güven aralıkları olarak anılmaktadır Yrd. Doç. Dr. İmran GÖKER
Güven Aralığı Tahmini • Bir aralık bir değerler dizisi vermektedir: • Örneklem istatistiğindeki örneklemden örnekleme varyasyonunu dikkate almaktadır • 1 örneklemden olan gözleme dayanmaktadır • Bilinmeyen ana kütle parametrelerine yakın olma hakkında bilgi vermektedir • Güven seviyesi olarak ifade edilir • asla %100 güvenli olamaz Yrd. Doç. Dr. İmran GÖKER
Güven Aralığı ve Güven Seviyesi • EğerP(a < < b) = 1 - iseo halde aralık a’danb’ye’nın%100(1 - ) güven aralığı olarak anılmaktadır. • (1 - )dearalığın güven seviyesi olarak anılmaktadır ( 0 ve 1 arasındadır) • Ana kütlenin tekrarlanan örneklemlerinde, parametresinin gerçek değeri yolla hesaplanan aralığında %100(1 - )’i içinde yer alabilmektedir. • Bu yolla hesaplanmış olan güven %100(1 - ) ile a < < b olarak yazılmaktadır Yrd. Doç. Dr. İmran GÖKER
μ’nün40 & 60 arasında olduğundan %95 eminim. Tahmin Süreci Rastgele Örneklem Ana kütle Ortalama X = 50 (ortalama, μ, bilinmiyor) Örneklem Yrd. Doç. Dr. İmran GÖKER
Güven Seviyesi, (1-) (devam) • Güven Seviyesi = 95% olarak varsayınız • (1 - ) = 0,95 olarak da yazılabilir • Bir göreli frekans yorumu: • Tekrarlayan örneklerden oluşturulacak tüm güven aralıklarının %95’i bilinmeyen gerçek parametreyi içerecektir • Bir spesifik aralık gerçek parametreyi içerebilir veya içermeyebilir • Spesifik bir aralığa hiçbir olasılık dahil değildir Yrd. Doç. Dr. İmran GÖKER
Genel Formül • Tüm güven aralıkları için genel formül: • Güvenilirlik faktörünün değeri arzu edilen güven seviyesine bağlıdır NoktaTahmini±(Güvenilirlik Faktör)(StandartHata) Yrd. Doç. Dr. İmran GÖKER
Güven Aralıkları Güven Aralıkları Ana kütle Ortalaması Ana kütle Orantısı Ana kütle Varyansı σ2biliniyor σ2bilinmiyor Yrd. Doç. Dr. İmran GÖKER
μ için Güven Aralığı(σ2Biliniyor) • Varsayımlar • Ana kütlevaryansıσ2biliniyor • Ana kütle normal dağılmış • Eğer ana kütle normal değilse, büyük örnekler kullanınız • Güven Aralığı tahmini: (burada z/2 her bir kuyruktaki /2 olasılığı için normal dağılımdır) Yrd. Doç. Dr. İmran GÖKER
Hata Payı • Güven aralığı • olarak da yazılabilir buradaHPhata payı olarak anılmaktadır • Aralık genişliği, w, hata payının iki katıdır Yrd. Doç. Dr. İmran GÖKER
Hata Payının Azaltılası Hata Payının azaltılması için • Ana kütle standart sapması azaltılabilir (σ↓) • Örnek büyüklüğü artırılır (n↑) • Güven seviyesi azaltılır, (1 – ) ↓ Yrd. Doç. Dr. İmran GÖKER
Güvenilirlik Faktörü z/2’nin Bulunması • %95’lik bir Güven Aralığını ele alalım: z = -1,96 z = 1,96 Z birimler: 0 Alt Güven Sınırı Üst Güven Sınırı X birimler: Nokta Tahmini • z0,025= 1,96’i standart normal dağılım tablosundan bulunuz Yrd. Doç. Dr. İmran GÖKER
Yaygın Güven Seviyeleri • Yaygın olarak kullanılan güven seviyeleri %90, %95, ve %99’dur. Güven Katsayısı, Güven Seviyesi Z/2değeri %80 %90 %95 %98 %99 %99.8 %99.9 0,80 0,90 0,95 0,98 0,99 0,998 0,999 1,28 1,645 1,96 2,33 2,58 3,08 3,27 Yrd. Doç. Dr. İmran GÖKER
Aralıklar ve Güven Seviyesi Ortalamanın Örneklem Dağılımı x Aralıklar ‘den ‘e uzanmaktadır x1 Oluşturulan %100(1-)’lık aralıklarμ’yü içermektedir; %100() ise içermez. x2 Güven Aralıkları Yrd. Doç. Dr. İmran GÖKER
Örnek • Büyük bir ana kütleden seçilen 11 devre 2,20 ohm’luk bir ortalama dirence sahiptir. Geçmişteki bilgilerden ana kütlenin standart sapmasının0,35 ohm olduğu bilinmektedir. • Ana kütlenin gerçek ortalamasını %95’lik bir güven aralığında belirleyiniz. Yrd. Doç. Dr. İmran GÖKER
Örnek (devam) • Büyük bir ana kütleden seçilen 11 devre 2,20 ohm’luk bir ortalama dirence sahiptir. Geçmişteki bilgilerden ana kütlenin standart sapmasının0,35 ohm olduğu bilinmektedir. • Çözüm: Yrd. Doç. Dr. İmran GÖKER
Yorum • Gerçek ortalama direncin 1,9932 ile 2,4068 ohm arasında olduğundan %95 eminiz • Gerçek ortalamanın bu aralıkta olmamasının da mümkün olmasına rağmen bu şekilde oluşturulmuş olan %95’lik aralıklar gerçek ortalamayı içerecektir Yrd. Doç. Dr. İmran GÖKER
Güven Aralıkları Güven Aralıkları Ana Kütle Ortalaması Ana Kütle Orantısı Ana Kütle Varyansı σ2biliniyor σ2bilinmiyor Yrd. Doç. Dr. İmran GÖKER
Student t Dağılımı • n gözlemlik bir rassal örneklemi ele alalım • ortalaması x vestandartsapmasıs olsun • ortalaması μ olan bir normal dağılımdan seçilmiş olsun • O halde değişken Serbestlik derecesi (n – 1) olanStudent t dağılımınıtakip Yrd. Doç. Dr. İmran GÖKER
μ için Güven Aralığı(σ2Bilinmiyor) • Eğer ana kütle standart sapması σbiliniyorsa, örneklem standart sapması, s’i yerine koyabiliriz. • Bu durum yeni bir belirsizlik ortaya koyar, çünkü s örnekten örneğe değişkenlik göstermektedir • Bu yüzden normal dağılım yerine t dağılımını kullanmaktayız Yrd. Doç. Dr. İmran GÖKER
μ için Güven Aralığı(σ2Bilinmiyor) (devam) • Varsayımlar • Ana kütlevaryansıσ2bilinmiyor • Ana kütle normal dağılmış • Eğer ana kütle normal değilse, büyük örnekler kullanınız • Student t Dağılımını kullanınız • Güven Aralığı Tahmini burada tn-1,α/2n – 1 serbestlik derecesine ve her bir kuyrukta α/2 alana sahip olan t dağılımının kritik değeri olarak anılmaktadır: Yrd. Doç. Dr. İmran GÖKER
Hata Payı • Güven Aralığı, • olarak da yazılabilmektedir buradaHPHata Payı olarak da anılmaktadır: Yrd. Doç. Dr. İmran GÖKER
Student t Dağılımı • t bir dağılımlar ailesidir • t değeri serbestlik derecesine (s.d.) bağlıdır. • Örneklem ortalamasından sonra değişme serbestisi olan gözlem sayısı aşağıdaki hesaplanmaktadır s.d. = n - 1 Yrd. Doç. Dr. İmran GÖKER
Student t Dağılımı Dikkat ediniz: t Z (n arttıkça) StandartNormal (sd= ∞ olan t) t (sd= 13) t-dağılmları çan eğrisi sergilerler ve simetriktirler, fakat ‘daha geniş’kuyruklara sahiptir t (sd= 5) t 0 Yrd. Doç. Dr. İmran GÖKER
Studentt Tablosu Üst Kuyruk Alanı Örnek: n = 3 sd= n - 1 = 2 = 0,10/2 =0,05 sd .10 .025 .05 1 12.706 3.078 6.314 2 1.886 4.303 2.920 /2 = 0,05 3 3.182 1.638 2.353 Tablo içeriği t değerlerini içerir olasılık değerlerini içermez 0 t 2,920 Yrd. Doç. Dr. İmran GÖKER
t dağılım değerleri Z değeri ile karşılaştırıldığında Güvent ttZ Seviyesi(10 s.d.)(20 s.d.)(30 s.d.) ____ 0,80 1,372 1,325 1,310 1,282 0,90 1,812 1,725 1,697 1,645 0,95 2,228 2,086 2,042 1,960 0,99 3,169 2,845 2,750 2,576 Dikkat: t Z (n arttıkça) Yrd. Doç. Dr. İmran GÖKER
Örnek n = 25 olan bir rastgele örnek x = 50 ve s = 8 değerlerine sahiptir.μ için %95’lik bir güven aralığı oluşturunuz • s.d.= n – 1 = 24, bu yüzden Güven Aralığı Yrd. Doç. Dr. İmran GÖKER
Güven Aralıkları Güven Aralıkları Ana kütle Ortalama Ana kütle Orantısı Ana kütle Varyansı σ2Biliniyor σ2Bilinmiyor Yrd. Doç. Dr. İmran GÖKER
Ana kütleOrantısı için Güven Aralığı • Ana kütle orantısı (P) için bir aralık tahmini örneklem orantısı ( )’nin belirsizliği için bir tolerans payı ekleyerek hesaplanabilmektedir. Yrd. Doç. Dr. İmran GÖKER
Ana kütle Orantısı P için Güven Aralığı (devam) • Eğer örneklem büyüklüğü yeterince büyükse örneklem orantısının aşağıdaki standart sapma ile yaklaşık olarak normal olduğunu hatırlayınız • Bunu bu örneklem verileri ile tahmin edeceğiz: Yrd. Doç. Dr. İmran GÖKER
Güven Aralığı Uç Noktaları • Popülasyon orantısı için üst ve alt güven sınırları aşağıdaki formül ile hesaplanmaktadır • burada • z/2; istenilen güven seviyesi için standart normal değeridir • ; örneklem orantısı • n; örneklem büyüklüğü • nP(1−P) > 5 Yrd. Doç. Dr. İmran GÖKER
Örnek • 100 kişilik rastgele bir örneklem 25’inin solak olduğunu göstermektedir. • Solakların gerçek orantısı için %95’lik bir güven aralığı oluşturunuz. Yrd. Doç. Dr. İmran GÖKER
Örnek (devam) • 100 kişilik rastgele bir örneklem 25’inin solak olduğunu göstermektedir. Solakların gerçek orantısı için %95’lik bir güven aralığı oluşturunuz. Yrd. Doç. Dr. İmran GÖKER
Yorum • Ana kütledeki solakların yüzdesinin %16,51 ile %33,49 arasında olduğundan %95 eminiz. • 0,1651 ile 0,3349 arasındaki aralığın gerçek orantıyı içermeyebilmesine rağmen büyüklüğü 100 olan örneklerden oluşturulan aralıkların %95’i gerçek orantıyı içerecektir. Yrd. Doç. Dr. İmran GÖKER
Güven Aralıkları Güven Aralıklar Ana Kütle Ortalaması Ana Kütle Orantısı Ana Kütle Varyansı σ2 Bilinmiyor σ2Biliniyor Yrd. Doç. Dr. İmran GÖKER
Ana Kütle Varyansı için Güven Aralığı • Güven aralığı örneklem varyansı s2’na dayanmaktadır • Varsayılan: ana kütle normal olarak dağılmıştır • Amaç:Ana kütle varyansı, σ2için bir güven aralığı oluşturmak Yrd. Doç. Dr. İmran GÖKER
Ana Kütle Varyansı için Güven Aralığı (devam) Rassal değişken (n – 1) serbestlik derecesi olan bir ki-kare dağılımı izlemektedir Buradaki-kare değeriaşağıdaki olasılık değerini temsil etmektedir Yrd. Doç. Dr. İmran GÖKER
Ana Kütle Varyansı için Güven Aralığı (devam) Ana kütle varyansı için %(1 - ) güven aralığı aşağıdaki gibidir Yrd. Doç. Dr. İmran GÖKER
Örnek Üretilen bir bilgisayar işlemcileri partisi test edilmektedir. Aşağıdaki veriler (MHz olarak) toplanıyor: Örneklem Büyüklüğü17 ÖrneklemOrt. 3004 Örneklem std sap 74 Ana kütlenin normal olduğunu varsayınız. σx2için %95 güven aralığını belirleyiniz Yrd. Doç. Dr. İmran GÖKER
Ki-kare Değerlerinin Bulunması • n = 17 ve ki-kare dağılımı(n – 1) = 16 serbestlik derecesine sahiptir • = 0,05, o halde her bir kuyruktaki ki-kare değeri 0,025’tir: Olasılık α/2 = 0,025 Olasılık α/2 = 0,025 216 216 216 = 6,91 = 28,85 Yrd. Doç. Dr. İmran GÖKER
Güven Sınırlarının Hesaplanması • %95 güven aralığı aşağıdaki gibidir: Standart sapmayı dönüştürürken, CPU hızının 55,1 ile 12,6 MHz arasında olduğundan %95 eminiz. Yrd. Doç. Dr. İmran GÖKER
Sonlu Ana kütleler • Eğer örneklem büyüklüğü ana kütle büyüklüğünün %5’i büyüklüğünde ise (ve örnekleme yerine koymaksızın oluyorsa) o halde standart hata hesaplanırken sonlu ana kütle düzeltme faktörü kullanılmak zorundadır. Yrd. Doç. Dr. İmran GÖKER