330 likes | 552 Views
MÜH 100 İSTATİSTİK. Yrd. Doç. Dr. Veysel Gazi TOBB Ekonomi ve Teknoloji Üniversitesi Elektrik-Elektronik Mühendisliği Bölümü. AMAÇ. Kitle ve örneklem arasındaki farkı öğrenmek Betimsel istatistiği kullanmayı öğrenmek (veri sıralaması, merkezsel eğilim ölçüleri, dağılım ölçüleri, vs.)
E N D
MÜH 100İSTATİSTİK Yrd. Doç. Dr. Veysel Gazi TOBB Ekonomi ve Teknoloji Üniversitesi Elektrik-Elektronik Mühendisliği Bölümü
AMAÇ Kitleve örneklemarasındaki farkı öğrenmek Betimsel istatistiğikullanmayı öğrenmek (veri sıralaması, merkezsel eğilim ölçüleri, dağılım ölçüleri, vs.) Histogramçizme ve okumayı öğrenmek Normal dağılımıve standart normal dağılımıtanımlamak Olasılık hesabı içinZ-tablolarıkullanmak
İstatistik • İstatistik olasılık kuramının yöntemlerine bağlı bir daldır - betimsel (descriptive) istatistik: veri toplamak, düzenlemek, özetlemek, sunmak ve incelemek • tümevarımsal istatistik (statistical inference): • verilere dayanarak sonuçlar çıkarmak • sonuçlara dayanarak kararlar almak • mühendisler tarafından çok kullanılır (meselakalite kontrol için)
Kitle ve Örneklem • Kitle (Population)– üzerinde çalışılan tüm gruba yada istatistiksel sonuçların genişletileceği gruba kitle denir • örnek:bütün sınıf, tüm ülke insanları, tüm kanser hastaları • Örneklem (Sample)– kitlenin bir alt kümesidir • örnek: bir takım, rasgele seçilen bazı insanlar • Bütün kitle hakkında sonuçlara varabilmek için genelde örneklem kullanılır.
Neden örneklem kullanılır? • Kitle çok büyük olabilir • dünyadaki tüm insanlar, uzaydaki tüm yıldızlar. • Kitleye ulaşmak imkansız olabilir • tarih öncesi insanları • Kitleyi incelemek tehlikeli olabilir • araba enkazları/kazaları, patlamalar • Kitleyi ölçmek zor olabilir • atomların alt parçacıkları • Ölçüm örneği kullanılmaz hale getiriyor olabilir • vidanın dayanma gücü
Örnek: • Sağındaki ve solundaki kişilerin yaşlarının ve kendi yaşının ortalamasını alarak sınıf yaş ortalamasını tahmin et. • Aldığın 3 kişilik örneklemhangi şartlarda sınıfı temsil etmez?
Merkezsel Eğilim Ölçüleri • Bir kitleyi (yada bir örneklemi) tek bir sayı ile tanımlamak/betimlemek istersek ne kullanırız? • Ortalama (Mean)– aritmetik ortalama • Mod (Mode)– en çok tekrarlanan (en sık görülen) değer. • Ortanca/Medyan (Median)– veri kümesinin “orta” değeri.
Ortalama nedir? • Ortalama verilerin toplamının veri sayısına bölümüdür.
Kitle Ortalaması • μ=kitle ortalaması • xi=veriler • N=kitledeki tüm gözlemlerin sayısı
Örneklem Ortalaması • = örneklem ortalaması • xi=veriler • n=örneklemdeki gözlemlerin sayısı
Ağırlıklı Ortalama • Ağırlıklarıw1,w2, …,wk,olan x1,x2, …, xk,verilerinin ağırlıklı ortalaması:
Örnek • Yandaki tabloda verilen ders ve notlar için ağırlıklı ortalama:
Mod Nedir? • mod– kesikli verilerde (yada kesikli aralıklara gruplanmış verilerde) en fazlagörülen değer. Örnek: MÜH100 dersini alan öğrencilerin çoğu EEM bölümünden.
Ortanca nedir? • Ortanca (medyan)– veriler sıralanmış olmalı • tek sayıda gözlem var ise ortanca orta değerdir • çift sayıda gözlem var ise ortanca iki orta değerin ortalamasıdır • Verilerde sapan değerler var ise ortanca verileri ortalamadan daha iyi betimler. • Örnek: Şu an bu odadaki kişilerin yaş ortalaması.
Dağılım Ölçüleri • Verilerin merkeze göre dağılımı tanımlayan ölçüler • değişim aralığı • ortalama mutlak sapma • standart sapma • varyans
Değişim Aralığı Nedir? • Değişim Aralığı (Range)– en büyük ve en küçük değerler arasındaki fark. • Örnek: A üniversitesinin B bölümünün tavan puanı 361 ve taban puanı 349 ise. • En düşük (Minimum) = 349 puan • En yüksek (Maksimum) = 361 puan • Değişim aralığı = 361-349 = 12 puan
Ortalama Mutlak Sapma • Herhangi bir verinin ortalamadan sapması • Tüm sapmaların toplamı sıfırdır • Ortalama Mutlak Sapma (OMS)
Standart Sapma • Kitle için Varyans = s2 Sapma • Örneklem için Varyans = s2
Standart Sapma • Verilerin dağılımı hakkında önemli bilgi vermektedir. • Matematiksel analiz için OMS’den daha uygun.
s ve s Farkı • s (örneklem varyansı) s‘nın (kitle varyansının) bir tahminidir. • s’nin hesaplanmasında n-1kullanılır ve bu daha iyi sonuç verir. • Eğer nbüyük ise n ve n-1 kullanımı arasındaki fark önemsizdir.
Önemli bir özellik • Standart sapmayı Gauss 1700’lerde yıldızların ölçülen konumlarındaki gözlenen hataları açıklamak için icat etmiş. • Bugün ise kalite kontrolden finansal risklerin ölçülmesi/hesaplanması’na kadar birçok yerde kullanılıyor.
Verilerin Düzenlenmesi • Bir gözlemde yada deneyde elde edilen verilere ham veri (raw data) denir. • Veriler genelde incelemeden önce büyükten küçüğe (yada tersi) sıralanır (sort edilir). • Sıralanmış veriler sınıflandırılır. • Sınıflar tüm verileri kapsayacak ve her veri sadece bir sınıfa dahil olacak şekilde tanımlanır. • Her sınıftaki eleman sayısına sınıf frekansı denir. • Veriler histogram kullanarak grafiksel olarak gösterilebilir.
Örnek • Müh 100 dersinin notları aşağıdaki gibi olsun
Örnek • Notlar büyükten küçüğe sıralanır. • En yüksek not (maksimum) = 75 • En düşük not (minimum) = 37 • Not değişim aralığı = 75 – 37 = 38 • Ortalama = 58’dir. • Ortanca 83 veri olduğundan 42’ci değerdir ve 57’dir. • Sıralanmış notlar 9 sınıfa ayrılır • Sınıflar 35-39, 40-44,45-49,…,75-79’dır • En fazla not 50-54 sınıfındadır – bu sınıf mod sınıfıdır.
Örnek • Her sınıfın frekansına göre histogram çizersek.
Veri Dağılımları • Verinin “şekli” frekans histogramı ile anlaşılır. • Frekans histogramlarında genelde oransal frekans (OF = sınıf frekansı/toplam frekans) kullanılır. • Çoğunlukla veriler “çan-eğrisi” şeklinde bir dağılım gösterirler ve bu tür dağılıma “normal” dağılım (distribution) denir. • Gauss yıldızların konum hatalarının “normal” dağılım gösterdiğini gözledi.
ortalama Normal Dağılım • Normal dağılım bazen “Gauss” dağılımı olarak da adlandırılır. OF Oransal (Relative) Frekans x
Standart Normal Dağılım Alan = 1.00 için
Bilinmesi Gereken Bazı Şeyler • z=-1 ve z=1 (x=-s ve x=s) arasındaki alan 0.6827’dır. • z=-2 ve z=2 (x=-2s ve x=2s) arasındaki alan 0.9545’dır. • z=-3 ve z=3 (x=-3s ve x=3s) arasındaki alan 0.9973’dır. • z=-4 ve z=4 (x=-4s ve x=4s) arasındaki alan pratik olarak 1.0’dır.
Bilinmesi Gereken Bazı Şeyler • Normal eğrisinde orta değer alanı %50’lik iki eşit bölgeye ayırır. • Normal dağılımeğrisi toplam 1.00 alana sahiptir. • “z-Tabloları” standart normal dağılım eğrisinin altındaki alanı gösterir ve z-eksenindeki herhangi iki nokta arasındaki alanı hesaplamak için kullanılabilir.
Z-Tabloları Kullanarak Olasılık Hesabı • Örnek: Kitabınızdaki Ek-C’deki Z-tablosunu kullanarak z= -1.0 ve z= 2.05 arasındaki alanı bulunuz. • Tablodan: z = 1.0 için alan = 0.3413 • Simetriden dolayı z = -1.0, için de alan = 0.3413 • Tablodan: z= 2.05 için, alan = 0.4798 • Toplam alan = 0.3413 + 0.4798 = 0.8211 • “Kuyrukların” alanı = 1.0 - 0.8211 = 0.1789
Özet • Merkezsel Ölçüler • ortalama • mod • ortanca • Dağılım Ölçüleri • değişim aralığı • varyans • standart sapma • Normal Dağılımı