540 likes | 1.71k Views
MÜHENDİSLİK İSTATİSTİĞİ (İSTATİSTİK-OLASILIK) Kaynaklar: . Probability, Seymour Lipschutz—Schaum’s serie) Ç: Olasılık, Hacer Kutluk
E N D
MÜHENDİSLİK İSTATİSTİĞİ (İSTATİSTİK-OLASILIK) Kaynaklar: . Probability, Seymour Lipschutz—Schaum’s serie) Ç: Olasılık, Hacer Kutluk . İstatistik , Filri Akdeniz, Ankara Üniversitesi . Uygulamalı İstatistik, Alaettin Kutsal vd, Hacettepe Üniversitesi . İstatistik , Ali Fuat Yüzer vd, Anadolu Üniversitesi , AOF ,Eskişehir. .Jeoistatistik. Necati Tüysüz, Trabzon
Konular: 1- Temel Kavramlar 2- Sıklık (Frekans) Dağılımları- İstatistik Seriler 3- Merkezi Eğilim ve Yayılım(Dağılım) Ölçütleri 4- Olasılık 5- Rasgele değişken kavramı 6- Rasgele değişkenlerin olasılık dağılımları 7- Kesikli Dağılımlar ve uygulamaları 8- Sürekli Normal Dağılım ve Geniş uygulamaları 9- Örnekleme ve Örneklem dağılımları (Test dağılımları) 10-İstatistik Tahmin ve Güven kavramı 11-Hipotez Testleri
Temel Kavramlar İstatistik: Yığın olayların belirli amaçlarla gözlenmesine ve bilimsel olarak incelenmesine, analizine ve yorumlanmasına yarayan teknikler ve yöntemler bilimidir. Birim: İstatistik kütlesini oluşturan yığın olayların herbirine denir. Örneğin insan, hayvan,bina , araba, doğum, evlenme , trafik kazaları istatistik birimlerdir. Özellik: İstatistik birimlerinin vurgulanmak istenen vasıflarına denir. Örneğin insanların yaşları, göz renkleri gibi. Ana Kütle: Yığın olay niteliğinde ve aynı cinsten birimlerin oluşturduğu topluluktur. Buna Ana Küme de denir.Örneğin; bir sınıftaki öğrenciler, Türkiye’deki çiçekler, Dünyadaki canlılar gibi. Örnek Kütle (Örneklem):Ana kütlenin ulaşılabilinen sınırlı sayıdaki elemanından oluşturulan Kütleye denir. Bu ana kümenin alt kümesidir.Örneğin; dünyadaki çiçekler ana kümesinin bir alt kümesi olan Türkiye’deki çiçekler örnek kütledir.
Örnekleme:Örnek Kütle (Örneklem) oluşturma işlemine denir. Pratikte genellikle Ana kütlenin tüm elemanlarını gözlemlemek mümkün olmaz. Bunun nedeni olarak tüm elemanlara ulaşmanın değişik nedenlerle mümkün olamaması , zaman , kaynak yetersizliği ve belli riskleri taşıması gösterilebilir. Örneğin; 1 milyon yıl önce yaşamış insanların kafatası boyutlarının araştırılması, etkinliği kesinleşmemiş bir kanser ilacının etkisinin tüm insanlarda denenmesi. Örnek kütle ana kütleyi temsil edebilme özelliklerine sahip olmalı, örneklemin birim (eleman) sayısı belli bir miktardan ( genellikle 30 dan) az olmamalıdır. Ana kütlenin herbir elemanının Örnek kütleye (Örnekleme) seçilme sansı eşit ise buna Rasgele Örneklem denir. İstatistik Problemlerinin çözümü genellikle 1.Adım: Problemin ortaya konması 2.Adım: Örneklemenin yapılması 3.Adım:Örnekleme sonuçlarının sergilenmesi 4.Adım: Sonuçların Ana Kütleye uygulanması adımlarını kapsar.
Frekans Dağılımları Bunlara sıklık dağılımları da denir. Burada, Rasgele bir örnekleme sonucu rasgele bir sırada elde edilen ham verilerin düzenlenmesi söz konusu olacaktır. 100 öğrencinin katıldığı bir sınavın, rasgele bir sırada elde edilen notları ham veri şeklinde aşağıda verilmiştir: 32,40,85,62,50,15,36,93,68,39,28,60,44,58,68,37,75,60,35,65,48,25,18,89,53, 87,75,37,55,66,25,80,44,53,27,70,36,48,72,28,95,62,75,45,58,85,70,50,90,75, 50,45,36,40,58,65,20,45,30,74,35,55,47,80,25,90,35,47,48,55,60,48,40,78,83, 39,53,30,47,42,55,39,32,60,55,50,68,55,72,20,66,53,50,27,78,32,40,65,45,35
Bu şekilde verilen ham verilerden, örneğin; a) en yüksek notu b) en düşük notu c) 45 alanların sayısını d) 60 dan fazla alanların yüzdesini e) 40-60 arası not alanların sayısını f) 42 den az alanların yüzdesini bulmak zordur. Bu amaçla, ham veriler ilgilenilen konuya göre bir düzene konulabilir. Örneğin; yukarıda rasgele sırada verilen ham veriler küçükten büyüğe veya büyükten küçüğe basit seri şeklinde aşağıdaki gibi sıralanabilir. 15 28 36 40 47 50 55 65 72 80 18 30 36 40 47 50 58 65 72 83 20 30 36 42 47 53 58 65 74 85 20 32 37 44 48 53 58 66 75 85 25 32 37 44 48 53 60 66 75 87 25 32 39 45 48 53 60 68 75 89 25 35 39 45 48 55 60 68 75 90 27 35 39 45 50 55 60 68 78 90 27 35 40 45 50 55 62 70 78 93 28 35 40 45 50 55 62 70 80 95
Bu basit seriden, yukarıdaki sorulardan a şıkkının cevabının 95, b şıkkının cevabının 15 , c şıkkının cevabının 4 olduğu kolayca görülebilmesine karşın d, e, f şıklarının cevaplarının yine de zor bulunabileceği anlaşılmaktadır. Bu seriye daha yakından göz atıldığında bazı not değerlerinin tekrarlandığı görülür. Tekrarlardan yararlanarak liste daha da kısaltılabilir. Tekrar sayıları (Mutlak yığılmalar) Frekans olarak adlandırılıp yukarıdaki basit seriden aşağıdaki Tablodaki Frekans serileri kolayca düzenlenebilir.
Notlar Frekanslar(Mutlak yığılmalar) 15 1 18 1 20 2 25 3 27 2 28 2 30 2 32 3 35 4 36 3 37 2 39 3 40 4 42 1 44 2 45 5 47 3 48 4 50 5 53 4 Notlar Frekanslar (Mutlak yığılmalar) 55 5 58 3 60 4 62 2 65 3 66 2 68 3 70 2 72 2 74 1 75 4 78 2 80 2 83 1 85 2 87 1 89 1 90 2 93 1 95 1
Bu şekilde düzenlenen Frekans serisinden yukarıdaki soruların cevapları basit seriye göre daha kolay bulunabilir. Ancak, veri sayısı artıp, binlere , milyonlara ulaştıkça bu şekilde düzenlenen frekans serilerinden yararlanmak güçleşir. Veri sayılarının arttığı durumlarda istatistik sonuçlara ulaşmanın en kolay yolu gözlemleri gruplara (sınıflara) ayırarak Sınıflandırılmış veya Gruplandırılmış Frekans serileri çizelgesi düzenlemektir. Çizelgede sınıflar ve bu sınıflara karşılık gelen gözlem sayıları (frekanslar) gösterilir. Gözlem sayıları 40-50 den fazla ise sınıflara ayırma işlemi uygulanır. Sınıflandırılmış Frekans serilerinin düzenlenmesi şu şekilde yapılır: * Sınıf sayısı (k) belirlenir N : Toplam gözlem (veri) sayısı , d: Sınıf genişliği , Xi: Gözlem değeri olmak üzere k sınıf sayısı tam sayı olarak veya veya şeklinde alınabilir.
Örnek Frekans Tablosu Düzenlemek Bir sınıftaki 70 öğrencinin boyları aşağıda verilmiştir. Seçeceğiniz sınıf genişliğine veya sınıf sayısına ve sınıf sınırlarına göre frekans dağılım tablosunu düzenleyiniz.
den k = 7,8,9 alınabilir. Sınıf sayısı Menzil R=182-152 = 30 Sınıf genişliği dan d= 3,4,5 den her biri alınabilir. . d =5 alırsak ilk sınıfın alt sınırına 149.5 dersek
Örnek 1 Frekans dağılım tablosu Toplam:70 Toplam:1
Örnek 2 Toplam:70
Örnek 3 Sınıf No Sınıf Sınırları Frekanslar 150,5 1 3 154,5 2 5 158,5 3 9 162,5 4 13 166,5 5 21 170,5 6 12 174,5 7 5 178,5 8 2 182,5
BİRİKİMLİ FREKANS DAĞILIMI Örnek kümeden
Soru: Ağırlıkları farklı N=400 elemanın frekans dağılımı aşağıdaki gibi verilmektedir. Çözüm Verilen Sınıf sınırları Frekans Bağıl BirikimliBirikimli Frekans Frekans Frekans Yüzdesi 1300-399 14 0,035 14 0,035 2 400-499 46 0,115 60 0,150 3 500-599 58 0,145 118 0,295 4600-699 76 0,190 194 0,485 5700-799 68 0,170 262 0,655 6 800-899 62 0,155 324 0,810 7900-999 48 0,12 372 0,930 8 1000-1099 22 0,055 394 0,985 9 1100-1199 6 0,015 400 1,000 400
Beşinci sınıfın üst sınırı nedir? Cevap: 799 • Sekizinci sınıfın alt sınırı nedir? Cevap: 1000 • Yedinci sınıfın sınıf orta değeri nedir? Cevap: d) Sınıf genişliği nedir? Cevap: 100 gram e) Dördüncü sınıfın frekansı nedir? Cevap: 76 f) Altıncı sınıfın bağıl frekansı nedir? Cevap: 62/400 = 0,155 g) Tablodan ağırlığı 600 gramdan az olanların yüzdesi nedir? Cevap: 0,295=%29,5 h) Ağırlığı 900 grama eşit veya daha ağır olanların yüzdesi nedir? Cevap: 1,00-0,81=0,19 = %19 0,12+0,055+0,15 =0,19 %19 i) Ağırlığı 500 grama eşit veya daha fazla fakat 1000 gramdan az olanların yüzdesi nedir? Cevap:1000 den az olanların yüzdesi 0,93 500 den az olanların yüzdesi 0,150 0,78 = %78
Soru Aşağıda N=400 birimlik kümeye ait birikimli frekans yüzdeleri verilen tablodan SınıflarBirikimli Frekans Yüzdesi 400 den az 0,035 500 den az 0,15 600 den az 0,295 700 den az 0,485 800 den az 0,655 900 den az 0,81 1000 den az 0,93 1100 den az 0,985 12000 den az 1.000 a) Ağırlığı 600 gramdan az olanların sayısını cevap: 0,295*400=118 b) Ağırlığı 900 gram ve daha çok olanların sayısını cevap: (1.00-0,81)*400=76 c) Ağırlığı 700’e eşit ve daha çok fakat 1000 gramdan az olanların sayısını Cevap: (0,93-0,485)*400=178 d) Ağırlığı 500 ve daha çok fakat 600 gramdan az olanların sayısını Cevap: (0,295-0,15)*400=58 e) Ağırlığı 700’e eşit ve daha çok fakat 800 gramdan az olanların yüzdesini Cevap: (0,655-0,485)=0,17=%17 f) Ağırlığı 400 ve daha fazla fakat 600 gramdan az olanların sayısını yüzdesini ve sayısını bulunuz. Cevap: (0,295-0,035)=0,26=%26 0,26*400=104
fi 2 Frekans Dağılımlarının Grafik Gösterimi Frekans dağılımları, elemanları ve bu elemanlara karşılık gelen frekansları gösteren iki sütundan oluşmaktadır. Elemanları bağımsız, frekanslar ise elemanlara göre değiştiğinden bağımlı değişken durumundadır. Bu nedenle İlgilenilen olayın aldığı değerleri yatay eksende, frekanslar ise düşey eksende gösterilir. 1) Nokta Diyagramı: Gruplandırılmamış seriler nokta diyagramı ile gösterilir. (Nokta dağılımı) • xi fi • 5 2 • 7 3 • 8 5 • 9 6 • 10 4 • 3 • 12 1 8 6 4 xi 0 24 5 6 7 8 9 10 11 12
2) Çizgili Diyagram (Çubuk diyagramı) fi
3) Histogram : Gruplandırılmış seriler Histogram ile gösterilir. Histogram, sınıf aralıklarından ve frekanslardan oluşan dikdörtgenlerden oluşur. Sınıf sınırları Sınıf orta değerleri Frekanslar (fi) 2-4 3 4 4-6 5 6 6-8 7 9 8-10 9 16 10-12 11 13 12-14 13 8 14-16 15 3
1) Bir Histogram her sınıfa her sınıfa ait bir dikdörtgenden oluşur. 2) Taban genişliği sınıf genişliği kadardır. 3) Dikdörtgenin orta noktaları sınıf orta değerine rastlar. 4) Dikdörtgenlerin alanları ait oldukları sınıfın frekans sayıları ile orantılıdır. 5) Yatay ve düşey ölçeğin aynı olması gerekmez. 4) (Dağılım Poligonu) Frekans Poligonu : Histogramdaki dikdörtgenlerin orta noktalarını birleştiren doğru parçalarından oluşur. Frekans poligonunun altında kalan alanla Histogram sütunlarının alanları toplamı birbirine eşittir. 5) Dağılım Eğrisi : Histogramdaki dikdörtgenlerin orta noktalarını birleştiren eğriye denir.
Uygulamalarda karşılaşılan frekans dağılımlarına uygun dağılım eğrisi şekilleri
MERKEZİ EĞİLİM ÖLÇÜTLERİ Bir gözlem grubunun özelliklerini belirlemeye yarayan ölçütlerden birisi merkezi eğilim ölçütüdür. 1- Aritmetik ortalama ( ) : En çok kullanılan Merkezi eğilim ölçütüdür. Bir seriyi oluşturan terimlerin toplamının terim sayısına oranına aritmetik ortalama denir. Deneysel ortalama Örnek: için N Teorik ortalama = =
Gruplandırılmış Gözlemlerden Aritmetik ortalama = = fi Örnek Gözlem değeri frekans 10 1 10 20 2 40 30 2 60 40 5 200 50 4 200 60 1 60 15 570 = = =38
* Sınıf aralıklarına göre gruplandırılmış serilerde aritmetik ortalama hesabı aynı şekilde yapılır. Ancak gözlem değerleri olarak sınıf orta değerleri alınır. Sınıflar Sınıf orta değerleri frekanslar fi 5-15 10 2 20 15-25 20 3 60 25-35 30 6 180 35-45 40 5 200 45-55 50 4 200 20 660 = = =33 Böyle ortalama bulunurken sınıflarda gözlemlerin sınıf ortasında toplandığı varsayılır. Bu nedenle sınıflara ayrılarak gruplandırılmış gözlemlerden bu şekilde hesaplanan aritmetik ortalama yaklaşıktır yani hata içerir.
Örnek: xi fi fi xi Sınıflar frekans sınıf orta değeri fixi fi xi 0 2 0 0-2 10 1 10 1 8 8 2-4 18 3 54 2 8 16 4-6 22 5 110 3 10 30 6-8 11 7 77 4 12 48 8-10 5 9 45 5 10 50 66 296 6 7 42 7 4 28 8 4 32 9 1 9 66 263 = 4.48 = 4.48 3.98 =3.98 =
Bağıl frekanslardan Aritmetik Ortalama Sınıflar Sınıf orta değeri ( ) frekans ( ) Bağıl frekans 0-2 1 10 0.1515 2-4 3 18 0.2727 4-6 5 22 0.3333 6-8 7 11 0.1667 8-10 9 5 0.07575 66 0.9999571 1 frekanslardan Bağıl frekanslardan = 0.1515*1+0.2727*3+0.3333*5+0.01667*7+0.07575*9 = 4.48 = = = =4.48 =
Ağırlıklı Ortalama Eğer bir kümeyi oluşturan elamanlar arasında önem derecelerine göre farklar varsa , ortalama Ağırlıklı Ortalama şeklinde alınır. Örnek: Ders Kredi Not A 2 75 B 3 45 C 1 90 Pİ (Ağırlık) P1 P2 . . . . . . PN = = = 62.5 = =
Gruplandırılmış serilerde = Aritmetik ortalama = = =70 2-Geometrik Ortalama G = G= = =4 3-Harmonik Ortalama = Örnek: =1,2,4,5 =2.05
4-Kareli Ortalama K= = 5-Medyan (ortanca=orta değer) Küçükten büyüğe veya büyükten küçüğe sıralanmış bir dizide en ortaya rastlayan değere denir. Örnek: 3,4,4,5,6, 6 ,7,8,8,10,11 (N tek sayı) Medyan=6 1,3,7,7,8,10,13,13,15,16 (N çift sayı) Medyan= =9 6- Mod (Doruk=tepe değeri) Bir dizide en çok tekrarlanan değere denir. Örnek:2,3,3,4,5,5,5,7,7,8 4,,5,5,6,6,6,7,7,8,8,8,10,12 Mod: 5 Mod1: 6 Mod2: 8 İki tane mod değeri var.
Aritmetik Ortalamanın Özellikleri a) Kümeyi oluşturan sayıların her birinin aritmetik ortalamadan farkının cebirsel toplamı sıfıra eşittir. 8 7.6 0.4 0.16 3 -4.6 21.16 5 -2.6 6.76 12 +4.4 19.36 10 2.4 5.76 0 53.20